蒸馏技术_标签-酷阅新闻

2026年AI泡沫：重演2020年地产崩盘逻辑

2019年3月有何重大事件？恒大的许家印公布了该集团2018年度的综合财务数据，这份成绩单可谓极度耀眼：中国恒大于3月26日收盘后发布了2018年业绩公告。报告指出：该年度公司总营收达4662亿、核心经营利润为783.2亿、归属股东净利润373.9亿，同比分别大增49.9%、93.3%与53.4%。2018年，公司毛利润达1689.5亿，同比攀升50.5%。根据沪深港三地交易所上市企业财报统计，这是地产行业首次有公司年度毛利跨越1500亿门槛。其中核心利润飙升93%，毛利大增50%，一举突破1500亿，可

2026-06-28 00:53:28 | 18 阅读

美国AI三强罕见结盟,折射出深层的技术危机感

开年之际，在硅谷的核心会议室内，OpenAI、Anthropic与谷歌三家一改往日互相戒备的姿态，破天荒地共同创建了"前沿模型论坛"组织。此举并非意在促进行业开放，而是肩负着一项特殊使命——联合应对来自中国的人工智能企业挑战。三方声称将共享信息、协同行动，防范中国企业通过所谓的"对抗性蒸馏"手段，利用美国AI模型的输出结果来训练自身系统。面对中国企业的快速追赶，这些美国科技巨头突然展现出前所未有的凝聚。合作的直接触发点，是2025年1月中国初创企业深度求索推出的R1推理模型。该产品的表现令美国竞争者感受到

2026-05-18 04:21:57 | 14 阅读

从“对话便宜”到“智能体便宜”：DeepSeek-V4引领大模型价格战进入智能体时代

每经记者兰素英每经编辑王嘉琦报道历经15个月的等待，今日（4月24日），DeepSeek-V4（预览版）终于面世，发布时间紧随OpenAI发布GPT-5.5之后仅数小时。在DeepSeek-V4约1000字的产品介绍中，“智能体”一词被反复提及，共出现11次。DeepSeek-V4通过专家模式（Pro）与快速模式（Flash）的双版本配置，将大模型价格战从“对话便宜”推向“智能体便宜”的新阶段。凭借全新的稀疏注意力机制与同策略蒸馏技术，DeepSeek-V4将推理成本压缩至新低，其中V4-Flash版

2026-04-24 17:52:17 | 11 阅读

告别“虚胖”拥抱“精瘦”：美国反蒸馏联盟的焦虑

告别“虚胖”拥抱“精瘦”：美国反蒸馏联盟的焦虑AI大模型虽发展迅猛，却遭遇了瓶颈。即便投入巨资堆砌万亿参数，也未能带来质的飞跃。你是否也有同感：向它提问一个简单问题，它却绕了半天弯路，罗列一堆背景，最后给出的答案还平平无奇。正因如此，“精馏小模型”（亦称精瘦模型）和“知识密度”的概念应运而生。知识密度 = 有用信息 / 参数规模与算力消耗依据这一公式，如今许多大模型实则是个“虚胖子”，吸纳了海量无关信息。这好比你去买颗菜，它却先给你科普了一整段农业发展史。大模型固然强大，但在诸多场景中，我们未必需要如此“

2026-04-18 07:36:24 | 23 阅读

AI时代的伦理难题，父母该怎样和孩子谈？

2026年4月，一个叫作"同事.skill"的GitHub项目悄然爆红。它的操作方式简单，却让人不寒而栗：把离职同事在飞书、钉钉、微信中的聊天记录、工作资料、邮件沟通等内容，统统输入AI系统——一个真实存在的人，就这样被"提炼"成一个可随时调用的"数字替身"。你给它发消息，它会用相似的语气回应；你曾写过的方案，它能够照样模仿；甚至你推责的习惯，它也能学得像模像样。不仅普通人如此，就连公众人物也未能置身事外。前段时间，一个名为"张雪峰.skill

2026-04-10 18:37:30 | 16 阅读

美国三大AI巨头罕见联手共同遏制模型蒸馏技术滥用

来源：Ai&芯片那点事儿OpenAI、Anthropic PBC及谷歌母公司Alphabet三方竞争对手已联手行动，力图阻止他国竞争者从美方尖端人工智能模型中窃取成果，从而在国际AI竞争中占据上风。彭博社援引知情人士消息称，这些企业正借助"前沿模型论坛"（Frontier Model Forum）这一平台互通情报。该论坛由上述三家企业联合微软于2023年创立，属于行业性非营利机构，专门侦测违背用户协议的"对抗性蒸馏"（adversarial distillation）活动。报道指出，此次少见的联手

2026-04-07 11:11:33 | 15 阅读