云知声U2登场：主打智能密度与执行能力，告别参数内卷

发布时间：2026-06-08 21:26阅读：25

2026年6月8日，登陆港交所的AI科技公司云知声（9678.HK）推出了全新通用基础模型U2。

在当前国内大模型赛道已从"百模大战"演变为"百模淘汰"的背景下，这条消息本身并不算新鲜。但深入了解U2的技术底牌和商业路径后，会发现它传递的信号颇具新意：它并非又一个万亿参数军备竞赛的参与者，而是对"参数越大越强"这一底层逻辑提出质疑的破局者。

一、近3000亿参数对阵万亿：重新定义"智能密度"

U2采用近3000亿总参数的MoE（混合专家）架构。这个数字在2026年的大模型格局中，看起来并不算大。

但云知声CEO黄伟提出了一个全新的衡量标准：智能密度。

他给出的公式是：AI商业价值 = 智能密度 × Token价值。 "智能密度"的核心在于，以更低的计算消耗换取更高的智能产出——不盲目追求参数规模，而注重每个参数的投入产出效率。过去三年，大模型的发展叙事一直被"参数军备竞赛"所主导——谁参数多谁就强，这几乎成了无需证明的共识。但真正的买单方——企业客户，看的从来不是"你的模型有多大"，而是"我投入一元算力能获得多少实际回报"。黄伟的这个公式将问题重新拉回商业本质：不是谁的模型最聪明，而是谁的智能性价比最优。这个思路能否站住脚，取决于U2在真实场景中的持续表现，但至少它提供了一种有别于"无限堆参数"的思考路径。

黄伟在一次媒体采访中打了个比方："我不需要一个中科院院士来开网约车。很多任务场景不需要最高智能，本科硕士水平就足够了。"

这个逻辑与DeepSeek在2025年探索的路径有异曲同工之处：小模型、更低成本、但单位Token的价值更高。业界也确实将U2视为云知声的"DeepSeek时刻"。

二、"为执行而生"：原生Agent不是外挂组件

大模型行业普遍存在一个痛点——模型"看起来什么都会，实际用起来却不行"。能写诗能聊天，但真让它独立完成跨步骤的复杂任务，比如自动处理一份保险理赔，它就开始出问题。

U2正是要解决这一痛点。它的核心定位是"原生通用Agent大模型"——工具调用、状态管理、多步规划、任务拆解等能力，从模型训练的第一天就是原生融合的，而非依赖后期外挂插件来弥补。

用黄伟的话讲："传统大模型是'为生成而设计'，U2从第一天起就是'为执行而设计'。"

这种设计理念的差异在实际场景中体现得淋漓尽致。在IFBench指令遵循评测中，U2表现位居行业前列；在Claw评测（Agent能力评估）中展现出卓越的智能体与工具调用能力。

具体而言，U2不只是"回答你的问题"，而是能够自主规划步骤：接到一个"生成客户季度投资报告"的指令后，它会主动调研持仓数据、分析行业风险、计算回撤表现，最终输出可直接使用的结构化报告。

"为执行而生"这一理念，意味着大模型赛道的竞争维度正在发生根本性分化。过去两年，几乎所有模型都在比拼"谁能回答得更好"。但企业客户真正需要的不是更会聊天的AI，而是一个能接手具体工作流、独立完成任务链的数字员工。U2若能在这一方向上形成明确的体验优势，其竞争对手就不是其他大模型，而是企业现有的外包团队和流程型软件——这是一个截然不同的市场。

三、不仅限于通用能力，更强在高效场景中的可靠执行

在医疗和金融这类高风险行业，AI最大的敌人不是"不够聪明"，而是"胡编乱造"——业内称之为"幻觉"。

U2采用一个关键的工程策略来解决这一难题：将"驾驭工程"（Harness Engineering）从应用层下沉至模型层。传统做法是模型本身不保证准确性，靠上层应用去做校验和纠错；U2的做法是在模型训练阶段直接嵌入约束和验证机制，从源头优化内容生成准确度，大幅减少不合理的虚构信息。

这一落地思路已有实际商业价值支撑。今年1月，人民日报曾报道，在北京友谊医院顺义院区肝病门诊室，当主治医生完成问诊，医疗门诊"智能体"便自动生成电子病历，主诉、现病史、既往史、检查建议等一应俱全。医生只需轻点鼠标，系统直接归档。

真正亮眼的是背后的工程思路：不是等出了问题再补救，而是从源头降低出错概率。在医疗和金融这种"错一次就可能出人命或丢大钱"的场景里，这种思路可能比单纯刷评测高分更有实际价值。

此外，依托全新U2基座能力，云知声同步完成自有OPC公有云MaaS平台全面上线，打通模型能力对外商业化的关键通道。平台整合U2原生Agent、高精度内容生成等核心能力，面向全行业开发者、中小企业开放标准化API接口，企业可按需调用模型能力、按Token实际消耗量结算成本，降低各类行业落地大模型的研发与算力门槛，加速AI能力在政务、金融、医疗等实体场景落地。

当通用能力逐渐成为大模型竞争的入场券，真正拉开差距的，可能是模型能否在高风险、高责任、高复杂度的高价值场景中持续稳定地"靠谱"。国内AI公司的发布会惯于用评测榜单说话，但云知声这次的叙事重心明显不同——它并不是放弃通用能力竞争，而是在通用能力进入第一梯队之后，进一步强调"工程思路"和"可靠执行"。换句话说，U2不是只想证明自己"会做题"，更想证明自己能在医疗、金融、政务等严肃场景里稳定完成任务、可靠交付结果。

这在当前市场上其实是一个相对清醒的定位选择。当大模型的能力区分度越来越依赖垂直场景的真实落地，"在医院门诊跑通了"比"评测第一"更有说服力。人民日报案例的引用也并非偶然——它恰好是"可信赖、可落地"这一品牌叙事的最佳注脚。

OPC MaaS平台的同步上线，则让这次发布多了一层商业逻辑的完整性：有模型、有场景、有对外开放的API通道，收入从项目制走向按量计费。对资本市场而言，这个商业模式的切换信号，可能比任何一个技术参数都更值得关注。

四、U2背后的商业闭环：从模型到收入的完整链路

技术再强，最终要看商业化能否成立。黄伟对U2的业务定位非常清晰：U2是底座，上面长出两条收入线——

ToB端：依托"兽牙"智能体平台（Shouya Agent Platform），将U2的能力封装为行业解决方案，面向医疗、医保、交通、客服、智慧工牌等场景输出。云知声近期已在多个领域连续中标，订单管线持续扩大。

ToC端（公有云MaaS）：通过OPC（Open Platform Cloud）生态开放API，让第三方开发者和企业按Token调用付费，持续产生收入。

这意味着，U2不仅是一次技术发布，更是云知声从"卖项目"转向"卖Token"的商业模式转轨的关键节点——收入不再仅仅依赖一单一单的合同交付，而是与客户的AI使用强度直接挂钩，理论上不存在规模天花板。

五、一个被低估的增长信号：Token调用收入ARR环比暴涨600%

在所有关于U2的技术参数和评测数据之外，有一个数字或许更值得资本市场关注：

受益于高质量场景Token的需求激增，云知声5月Token调用收入的ARR（年化经常性收入）环比涨600%，预计6月ARR将继续保持高增长，达到1500万美金。

这个数字的含义是：不是偶发性的大单贡献，而是来自持续调用的API收入——客户用得越多，收入越高。当医院每天在跑数百份病历生成、保险公司每天在跑数千份理赔审核、政务窗口每天在跑方言转写服务时，Token就在源源不断地产生。

换句话说，云知声的收入结构正在从"签合同-交付-回款"的传统项目制，切换为"按使用量持续计费"的SaaS/MaaS模式。从5月份的ARR数字已经看到，这种模式已经跑通，其收入的可预测性和天花板都正在发生质变。

六、从"语音公司"到"大模型第一梯队"的身份蜕变

回顾这家公司的成长轨迹，梳理一下云知声的发展历程：

- 2012年成立，以语音云平台起步

- 2018年发布业界首款车规级全栈语音AI芯片

- 2020年启动预训练大模型研发

- 2023年发布"山海"通用大模型

- 2024年港股上市，成为"港交所AGI第一股"

- 2025年大模型业务收入6.1亿元，同比增长10倍，占总收入超50%

- 2026年发布U2，上市一周年，对标国产大模型第一梯队

2025年财报数据显示：总营收12.1亿元，同比增长29%；下半年经调整净利润仅亏损400万元，接近盈亏平衡；研发投入3.8亿元，占经调整三费75%，研发人员占比69%。人均产值252万元，在AI头部企业中排名靠前。

黄伟把2023-2025年定义为大模型的"热身赛"，而2026年行业正式进入"生产力AI"的正赛。U2是云知声手中那张证明自己有资格上场的门票。

云知声在品牌和C端的存在感不算最强。但如果换一把尺子——看谁的模型真正在帮企业省了钱、提了效，看谁的Token收入在真实地增长，看谁在医疗和金融这种高门槛场景里站住了脚——U2确实提供了一份有说服力的成绩单。

大模型行业在2026年的一个重要分水岭是：光会"说"的模型正在快速贬值，能"干活"的模型才有定价权。云知声押注的正是后者。这条路似乎不性感，也似乎不会在社交媒体上引发狂欢转发——但可能回头看才会发现，这才是AI商业化最不绕弯的路径。

← 上一篇：赛力斯新品牌赛豆明日发布，首款轿跑同步亮相并主攻海外下一篇：多屏随心用！中兴云电脑开启AI全场景时代 →