模型压缩_标签-酷阅新闻

AI周刊0715|DeepSeek V4全面发布、全球首推情感监管、WAIC即将启幕

灯下拾斯文 · AI周刊 | 2026.07.15今日AI头条DeepSeek V4全面发布 · 全球首部AI情感陪伴监管落地 · WAIC 2026临近01 DeepSeek V4正式全量发布，首创分时定价策略7月15日，DeepSeek V4正式全量发布，推出Pro旗舰版（1.6万亿参数）与Flash轻量版（2840亿参数）双产品线，全系配备100万字超长上下文窗口。最具突破性的是行业首创的峰谷分时定价机制：工作日9:00-12:00、14:00-18:00高峰时段API价格翻倍，其余17小时及周末全

2026-07-15 21:26:58 | 27 阅读

Khosla风投押注轻量化，iPhone本地运行最大AI模型

苹果公司（股价316.22美元，涨幅0.90%）正加速推进大模型小型化，以在iPhone上实现高效能AI的本地运算。这样做不仅能减少云计算成本，还能加强用户隐私保护。一家今年刚结束隐身阶段的初创企业宣布，其已在iPhone上成功部署了参数量超越以往所有手机端模型的大型AI系统。这家名为PrismML的初创公司透露，已将中国电商巨头阿里巴巴（股价111.14美元，涨幅1.98%）开源的大型语言模型“通义千问3.6”（Qwen 3.6）成功压缩并适配，可在iPhone 17 Pro上完整本地运行。该模型参数

2026-07-10 19:55:25 | 36 阅读

MacBook 运行 Fable 5 还要等多久？

Fable 5 传出好消息，原本计划今天下午就结束服务，现已延期至 12 号才暂时告一段落，此后订阅用户将无法再用套餐额度进行体验。短短几天内，许多人已深深喜爱上它却又面临失去。这不禁让人想象，如此级别的模型何时才能在我们自己的设备上运行？过去人们谈论前沿模型时，话题常围绕「它有多强大」「它比对手快多少」「它能替代哪些工作」。但这次，有人开始询问「它能否在终端侧运行」，这个问题的提出本身就是一种迹象：表明终端侧 AI 这件事已经从行业术语转变为大众的期盼。不过说实话，这个想法目前仍过于乐观。Fabl

2026-07-09 06:01:48 | 24 阅读

揭秘端侧 AI：为何手机无需联网也能运行智能？

一句话答案端侧 AI（On-device AI）意指将人工智能模型直接部署于您的手机或电脑中运行，无需经过互联网，所有运算均在本地设备完成——如同本地应用，断网亦可使用。为何我们需要了解它您或许已察觉，Apple 在 2026 年 6 月的 WWDC 上把端侧 AI 置于宣传首位；Google 也在 I/O 大会上宣布 Gemini Nano 已运行于 Android 手机之中。但这绝非仅是新闻标题。它改变了一个关键点：您与 AI 的每一次对话，究竟流向何处。云端 AI（即我们最熟悉的那类）的工作原理是：

2026-06-30 23:02:49 | 30 阅读

端侧AI崛起：专利竞争重新划定边界

谈到人工智能，多数人脑海中浮现的仍是ChatGPT这类的云端服务——在对话框中输入问题，AI在远程服务器进行运算，再将结果返回。然而2026年，这一剧本正在被改写。CES 2026上最火爆的关键词并非云端大模型，而是本地AI。从离线多语种翻译、本地图像生成到机械臂即时控制，这些原本依赖云端处理的复杂任务，如今在手机、笔记本和智能眼镜中就能顺畅完成。中国信通院预测，未来三年国内AI手机和AI PC市场渗透率将分别超过50%和80%。这场从云端向终端的迁移，正在开启一片知识产权的新领地。核心要点：云端AI模式

2026-06-14 08:56:26 | 23 阅读

AI圈 | 基元律动人才招募

2. 熟练掌握 PyTorch 等深度学习技术体系。3. 熟悉大模型、AI Agent、NLP、强化学习、模型压缩加速等技术方向，具备相关项目实践经历者优先考虑。4. 具备优秀的问题分析与解决能力，以及工程实践落地经验，能够适应创业型团队的工作节奏。5. 对 AI Agent 领域充满热情，致力于从事具有技术挑战和商业落地价值的项目研发。薪酬福利与工作模式邮件主题及简历请注明：姓名-应聘职位

2026-06-09 14:33:05 | 8 阅读

十图详解边缘 AI 全球产业生态

以往提及 AI，人们脑海中浮现的往往是云端的大规模模型与数据中心内的 GPU。然而，日益增长的智能正悄然融入我们周遭的设备之中：智能手机、汽车、监控摄像头、机器人以及工厂机械……它们不再仅仅是数据的收集者，更开始在本地进行理解、决策与响应。这便是边缘 AI。其核心宗旨并非取代云端，而是推动 AI 贴近现实世界，以此降低延迟、保障隐私，并减少对网络传输及云端算力的依赖。简而言之，就是赋予终端设备更强的自主智慧。边缘 AI 依托于一条完整的产业链：芯片、传感器、模型压缩技术、软件栈、终端硬件以及行业应用场景，

2026-06-07 21:32:14 | 20 阅读

AI推理新纪元：芯片逻辑重塑

从英伟达的巨额投资，到初创企业密集推出产品，再到资本市场对这些企业展开估值，可以清晰看出，在AI推理阶段，行业竞争焦点已从“更大模型”逐步转向“更高效模型”。AI芯片产业的核心逻辑，正从训练算力向推理效率转变。在2022年生成式AI爆发初期，行业竞争的核心集中在模型训练上。谁能训练出最强模型，谁就占据竞争优势。因此，大量资本涌入参数规模和芯片资源堆叠，以追求模型能力与规模的飞跃。但随着AI服务进入常态化部署阶段，成本结构已发生改变。训练属于高资本投入、低频次的研发行为，而推理则是高频、长期的持续性成本，并

2026-05-29 19:25:49 | 31 阅读

AI 蒸馏揭秘：究竟提炼了何种精华？

模型蒸馏绝非将大型模型简单压缩为 zip 文件，亦非机械地复制参数。它更像是一位“教师模型”通过大量解题、讲解与提供答案，利用这些成果去培育一个更小巧、成本更低且易于部署的“学生模型”。蒸馏看似神奇，但要真正理解它，只需厘清三个核心问题：依据什么进行蒸馏？过程中习得了什么？最终产出的究竟为何？近期，“模型蒸馏”的话题再度引发热议。缘由十分直接：大模型能力虽强，成本却日益高昂。并非每家企业都能长期依赖顶级模型支撑业务，也非所有应用场景都需要在每次请求时调用最强模型。于是，一个极具现实意义的问题摆在了面前：能

2026-05-20 08:07:27 | 10 阅读

知识蒸馏精要：三类核心知识解析与最优选择策略

第三章知识形态归类与蒸馏目标甄选方略继第二章构建"师-生"框架之后，一个关键命题随之而来：学生模型应当汲取何种知识？知识蒸馏远非简单的"照搬照抄"。教师模型内部蕴藏着多层信息，涵盖最终决策、中间推演过程以及抽象逻辑关联。甄选不同的"知识形态"作为蒸馏标的，将直接影响学生模型的性能天花板与训练复杂度。本章将系统剖析三类核心知识形态，并给出实用的遴选策略，助您在工程实践中作出最佳判断。依据知识在神经网络中的呈现方式，可将其划分为三个层级：输出特征（响应）、中间特征（表征）与关系特征（结构）。此属最经典、最基

2026-04-15 18:48:56 | 13 阅读