AI Daily | DeepSeek 多模态论文亮相,国产模型周调用量首超美国
五一假期刚刚收尾,OpenAI 便投下了一颗重磅炸弹。5 月 6 日凌晨,ChatGPT 的默认模型悄然从 GPT-5.3 切换为 GPT-5.5 Instant。
坦率而言,此次升级最值得留意的并非参数规模的扩大或推理性能的提升,而是一项偏向实用的改进——幻觉率骤降 52.5%。
这意味着什么?以往向大模型提问时,它可能信心满满地抛出一个错误答案。如今 GPT-5.5 学会了“知之为知之”——减少信口开河,把握分寸,不再絮絮叨叨。
OpenAI 官方公布的四项核心升级方向为:幻觉减少、协作能力增强、输出更为克制、更贴合人类的沟通节奏。
:OpenAI 这步棋颇具深意。当各模型能力趋于接近,继续在“谁更强”上较劲的边际收益已相当有限。而“谁能更可信”才是医疗、法律、金融等高风险场景下企业用户真正关注的焦点。这远比发布一份“参数量翻倍”的新闻稿更有价值。
五一假期首日,DeepSeek 便抛出一枚重磅炸弹——发布了多模态论文,随后连夜撤下。但信息已然传播开来。
论文的核心要点是:DeepSeek 正式宣告进军多模态领域。团队负责人陈小康发布了一条意味深长的动态:“此刻,我们能看见你了。”
换句话说:DeepSeek 的对话产品即将具备视觉理解能力。图像识别功能已进入灰度测试阶段,部分用户现已可上传图片供 DeepSeek 解析。
同一天,华为也宣布昇腾全系列产品与华为云将全面支持 DeepSeek V4 系列。多模态版本预计于 5 月内推出。
:DeepSeek 的多模态能力并非从零起步,而是依托 V4 系列的延续。真正值得关注的是华为昇腾的全面适配——这意味着国产芯片生态对 DeepSeek 的承载能力已初具规模。从“能用英伟达”到“用国产也没问题”,中国 AI 产业在降低外部依赖的道路上又前进了一步。
5 月 6 日,国产大模型领域传出两条重大融资消息。
月之暗面(Kimi)即将完成新一轮约 20 亿美元融资,融资后估值突破 200 亿美元。本轮由美团龙珠领投,中国移动、CPE 等跟投,仅美团龙珠一家便出资超 2 亿美元。
回顾 Kimi 今年的融资历程:1 月 5 亿、2 月 7 亿+7 亿,加上本轮 20 亿,半年内累计融资超 39 亿美元。ARR 也从 1 亿美元快速攀升至超 2 亿。
同一日还传出 DeepSeek 首次启动外部融资的消息——国家集成电路产业投资基金等机构正在洽谈领投,融资后估值或达约 450 亿美元,腾讯等互联网巨头也在密切关注。
:这组数据揭示了几点重要信息。首先,资本对国产大模型的信心正从“看概念”转向“看收入”——Kimi 的 ARR 数据便是明证。其次,DeepSeek 从“不融资不商业化”转向首次启动融资,标志着行业从“理想主义时期”正式迈入“商业竞争时期”。第三,450 亿美元这一估值若坐实,将成为国产 AI 公司的新标杆。
这可能是近期最易被忽视却最为硬核的一组数据。
依据 OpenRouter 等第三方平台统计,4 月 27 日至 5 月 3 日,国内 AI 大模型周调用量达到 7.942 万亿 Token,环比激增 81.7%,连续两周超越美国。
更值得关注的是,调用量排名前五的模型中有四款来自中国厂商——MiniMax M2.5、月之暗面 Kimi K2.5、智谱 GLM-5 和 DeepSeek V3.2,合计贡献了前五总调用量的 85.7%。
:这组数据的价值在于——它并非厂商自行公布的宣传数字,而是源自 OpenRouter 等第三方平台的实际调用统计。表明中国大模型在应用端的渗透速度或许比大多数从业者的感受更为迅速。当然,调用量不能完全等同于质量,但它至少揭示了一个趋势:用户在使用,而且使用的人数在持续增加。
马斯克诉 OpenAI 案的庭审进入第四天,出现了令整个行业无法淡定的对话。
OpenAI 律师质询 xAI 是否通过蒸馏 OpenAI 的模型来训练自身模型,马斯克当下回应:“所有 AI 公司都在这么做。”
:模型蒸馏——利用大模型的输出训练小模型——在技术上本是常规操作。但在法律与伦理层面,始终处于模糊地带。马斯克此番表态相当于将行业内心知肚明却无人愿公开言明之事摆到了台面上。这可能加速相关监管框架的建立,也可能使 AI 公司之间的“数据边界”问题更为敏感。对于普通用户而言,这意味着你所使用的每款 AI 产品背后,可能都融合了多家模型的知识。
浏览完这五条资讯,我最大的感触是:2026 年 5 月的 AI 圈,正在同步经历三件大事——技术加速迭代、商业格局重塑、行业规则重建。
OpenAI 追求可信而非更强,DeepSeek 闯入多模态领域,Kimi 半年融资 39 亿——这些是技术迭代与商业竞争。但马斯克在法庭上承认模型蒸馏,才是真正影响深远的变量:当一个行业的核心玩法面临法律与伦理审视,谁会成为首个被卷入漩涡的对象?
:
1. 若你从事 AI 产品工作,关注“可靠性”比关注“更强”更为关键——GPT-5.5 的方向便是信号 2. 若你关注国产大模型,调用量超越美国一事值得持续追踪——质量未必领先,但规模已然领先 3. 若你从事投资工作,Kimi 的 ARR 增速(2 个月从 1 亿到 2 亿美金)值得深入研究 4. 若你是 AI 创业者,需关注模型蒸馏的合规边界——马斯克此番操作可能催生新的行业规范
:
当所有 AI 公司都在利用他人模型训练自身模型,你认为这算“窃取知识产权”还是“行业的常规操作”?
欢迎在评论区分享你的见解。