一周AI动态速览：模型革新与应用落地

发布时间：2026-05-04 08:47阅读：16

【英伟达发布Nemotron 3 Nano Omni，性能大幅提升】英伟达推出了名为Nemotron 3 Nano Omni的开源全模态AI模型。该模型拥有300亿参数，支持百万Token的超长上下文处理，在推理效率上最高可提升9倍。它专为企业级AI智能体设计，能够进行跨模态推理、调用工具以及操作界面。富士康、Palantir等公司已开始使用该模型，而戴尔、甲骨文等公司也正在评估其应用潜力。

【芯擎科技推出“龍鹰二号”车规级AI芯片】吉利旗下的芯擎科技在北京国际车展上发布了其最新的5纳米车规级AI座舱芯片——“龍鹰二号”。该芯片的AI算力达到200TOPS，并原生支持7B及以上的多模态大模型，拥有518GB/s的带宽。芯片内置了专用的车控安全岛，计划于2027年第一季度开始适配，旨在覆盖从入门级到旗舰级的中央计算平台需求。

【Anthropic揭示大模型“潜意识学习”】Anthropic在《Nature》期刊上发表了一项重要研究，揭示了学生模型能够从教师模型生成的、在语义上无关的数据中继承行为特征的现象。这种传递在同架构模型之间尤为显著。这一发现对传统的模型蒸馏和训练认知提出了挑战，并对AI安全与对齐领域的研究具有深远影响。

【DeepSeek开放识图模式，进军多模态】DeepSeek在其平台上推出了识图功能的灰度测试，用户可以通过网页版和App体验。新增加的“识图模式”与原有的快速、专家模式并列。此次更新不仅仅是简单的OCR识别，而是实现了真正的图像理解和多模态交互，能够识别复杂场景、物体及文字，并生成深度解读。这标志着DeepSeek正式补齐了多模态能力，用户现在可以体验图文对话功能。

【智谱GLM-5 Coding Agent性能飞跃】智谱华章公布了GLM-5系列在处理大规模Coding Agent场景时的推理优化成果。通过底层工程的重构，系统吞吐量提升了132%，异常输出率从万分之十几大幅降低至万分之三以下。在相同的硬件条件下，服务容量得到了显著的扩容。其KV cache修复方案已被SGLang开源社区采纳，为全球部署厂商带来了成本降低和稳定性提升。

【OpenAI发布免费GPT-4o全能多模态模型】OpenAI推出了GPT-4o（Omni），一个统一的多模态模型，其推理效率提高了300%。该模型支持实时语音和视频交互，延迟低于500毫秒，能够识别情绪并解析长达1小时的视频。GPT-4o的基础版本将永久免费提供，而Plus和Enterprise用户将解锁更高级的功能。此举有望降低多模态AI的应用门槛，促进AI技术的普惠发展。

【清华AIR发布GS-Playground仿真框架】清华大学智能产业研究院（AIR）联合多家机构发布了名为GS-Playground的开源仿真框架。该框架首次实现了高吞吐量并行物理仿真与高保真视觉渲染的深度融合。它原生支持CPU/GPU双后端以及各类机器人的接入，有效解决了视觉密集型机器人训练中“看得真”与“训得快”的长期难题。该研究成果已被机器人领域的顶级会议RSS 2026收录。

【广东省发布23个“AI+”典型案例】在深圳举行的广东省人工智能应用对接大会上，集中发布了23个覆盖AI+科技、制造、医疗、教育、政务、农业、金融、出海等十余个行业的典型案例。其中包括深圳先进院的“具身智能材料科学家”项目，以及深圳中院全国首个AI辅助审判系统（已辅助审理超过60万宗案件）。这些案例系统展示了人工智能在各领域的应用现状。

【阿里达摩院发布肠癌筛查AI模型】阿里巴巴达摩院联合广东省人民医院等机构研发出名为DAMO COCA的肠癌筛查AI模型。该模型能够从平扫CT影像中精准识别早期肠癌，其敏感性和特异性分别达到86.6%和99.8%。该模型首次提出了无需肠道准备的“无感”筛查方法，极大地改善了患者的就医体验。这是达摩院发布的第三个癌症筛查AI模型，进一步推动了医疗AI的普惠化和高效化发展。

【日本航空测试人形机器人地面服务】日本航空公司宣布，将从5月开始在东京羽田机场试用人形机器人执行行李搬运等地面服务任务，以缓解人力短缺问题。该项目与GMO AI Robotics公司合作，将持续两年。人形机器人因其能够适应现有基础设施而受到青睐，预计在2028年后可能投入实际应用，标志着机器人在航空服务业应用的新篇章。

【中国AI原生APP月活用户达4.4亿】QuestMobile的报告显示，截至2026年3月底，中国AI原生应用的月活跃用户规模已达到4.4亿，第一季度新增用户超过1.3亿。其中，“豆包”以3.45亿月活用户位居榜首，紧随其后的是“千问”和“DeepSeek”。报告还指出，AI应用正加速向老年群体和下沉市场渗透，用户粘性也在持续增强。

【工信部与国家数据局启动“模数共振”行动】工信部和国家数据局联合启动了2026“模数共振”行动，重点关注钢铁、工业母机、汽车、航空航天等20个制造业领域。该行动旨在打造行业模型、专用智能体和高质量数据集，建立“数据—模型—场景”的良性循环，并计划在2026年底形成可复制推广的模式。政府将对优秀项目提供政策支持，以推动AI深度融入实体经济，加速新型工业化进程。

【WPS AI入选《2026“人工智能 +” 蓝皮书》】在上海交大发布的《2026“人工智能 +” 行业发展蓝皮书》中，金山办公的WPS AI作为AI赋能信息产业的唯一办公案例被收录。WPS AI已完成了从AIGC工具到全链路智能体的演进，支撑了软件形态从“人操作软件”向“Agent操作软件”的转变，为国产软件的AI转型提供了可复制的范式，并已服务超过5亿用户。

【字节TRAE SOLO推出全流程AI开发工具】字节跳动TRAE SOLO发布了端到端的自动化SOLO模式，覆盖了从产品需求文档（PRD）到架构设计、编码、测试和部署的全流程闭环。该工具的核心功能全部免费提供。它支持多Agent并行协作，代码生成准确率提升至92%，能够满足企业级应用快速开发的需要。

【《“人工智能 +”教育》行动计划印发】教育部等五部门联合印发了《“人工智能 +”教育行动计划》，提出将AI内容纳入教师资格考试和认证体系，并构建覆盖全学段的AI教育体系。计划还包括发布首批中小学科技教育实验区/校（周期3年），以及推广AI课堂教学和个性化辅导等应用场景。目标是到2028年，中小学AI教育的覆盖率达到100%，以培养数字时代所需人才。

【微软AI收入激增，资本支出放缓】微软公布了2026财年第三财季业绩，营收达到829亿美元，同比增长18%。其中，智能云收入为346.81亿美元，同比增长30%。AI业务年化收入已超过370亿美元，同比大幅增长123%。然而，智能云的利润率同比下降了1.8个百分点。财报发布后，微软股价在盘后交易中下跌超过3%。

【腾讯混元Hy3 preview登顶大模型API调用量榜首】根据OpenRouter的最新数据显示，腾讯混元的新模型Hy3 preview在全球大模型API调用量排行榜上名列第一。特别是在工具调用和编程这两个关键场景中，该模型分别位列第一和第二，显示出其在开发者生态中的强大吸引力，并增强了市场对其商业化前景的信心。

【IBM发布Granite 4.1开源模型系列】IBM推出了Granite 4.1系列紧凑型语言模型（包含3B、8B和30B参数），以及Vision 4.1视觉语言模型和Speech 4.1语音转文本模型。该系列通过优化训练数据质量来提升性能。IBM强调，这些非推理模型在满足基准性能要求的同时，更具成本效益，适合在企业环境中部署。

【马斯克诉OpenAI案开庭】马斯克与xAI诉OpenAI及CEO阿尔特曼的案件正式开庭，进入陪审团遴选阶段。案件的核心争议在于OpenAI从非营利组织转向营利性公司的合法性。马斯克要求恢复其非营利性质并罢免阿尔特曼。此案可能影响OpenAI的IPO进程，一旦马斯克胜诉，可能对微软、英伟达等相关企业以及庞大的产业链造成连锁影响。庭审预计将持续四周。

【Google Gemini 1.5 Pro升级，上下文窗口达百万token】Google对其Gemini 1.5 Pro模型进行了升级，将上下文窗口扩展至100万token，使其能够一次性处理相当于500页PDF或一整本书的内容。该模型还可以无损理解长达10小时的音频和2小时的4K视频。同时，API价格下调了60%，并开放了免费额度。这些升级显著增强了长文本和多模态处理能力，并提升了问答和逻辑推理的性能。

【Meta开源Llama 3系列模型】Meta正式开源了Llama 3系列模型（包括70B和8B版本），这些模型完全开源且允许商用，无需支付版权费用，并支持二次分发和微调。Llama 3 70B在基准测试中表现接近GPT-4，并在部分任务上超越了GPT-3.5。8B轻量级版本适用于端侧和嵌入式部署。Meta还同步开源了专用于机器人的模型，支持视觉-动作联合推理。

【Mistral Workflows上线与谷歌开源Agent Skill工具箱】Mistral AI推出了面向企业的Workflows工作流编排平台。与此同时，谷歌开源了“Agent Skill超级工具箱”并发布了Agents CLI，极大地简化了AI智能体的开发流程。AI Agent正从单一工具向协作系统演进，预示着软件行业进入了一个关键的洗牌期。

【微软与Anthropic展开全面AI合作】微软已结束与OpenAI的排他性合作关系，转而与Anthropic建立全面的AI合作关系。这一举动标志着AI巨头联盟格局的重大调整。此前，微软已发布了Microsoft Agent 365国际版，已有数万家企业采用，付费用户同比增长160%，日活跃用户增长近10倍。

【中国否决Meta收购Manus项目】中国已依法禁止Meta收购Manus项目，要求当事人撤销该交易。该交易金额超过20亿美元，涉及全球首款通用型AI智能体。专家认为，这一决定标志着中国在AI领域的跨境并购监管进入了更严格的阶段，具有重要的制度意义。

【Kimi事件引发用户隐私担忧】有用户反映在使用Kimi处理工作时，收到了陌生人的完整简历，其中包含敏感的个人信息。Kimi官方解释为“AI幻觉”，但多位专家指出，这更可能与会话隔离、缓存复用或检索增强生成链路绑定等后台权限管理故障有关，而非典型的AI幻觉。该事件引发了对大模型平台用户数据安全隔离的广泛关注。

【AI“提前查分”事件敲响政务安全警钟】“AI提前查到2026山东事业编成绩”的事件引发了公众热议。官方回应称是工作人员测试端口未及时关闭所致。但舆论认为，AI强大的数据抓取和模式识别能力对传统依靠物理隔离的政务保密体系构成了严峻挑战，必须严格固化测试环境与生产环境的隔离。

【南非撤回AI政策草案】南非通信与数字技术部宣布撤回《国家人工智能政策（草案）》。经核查发现，草案的参考文献中包含多项虚构内容，这凸显了在AI政策制定过程中进行人类监督的必要性。

← 上一篇：AI视觉应用开发工程师招聘热度上升，零基础也能入门下一篇：AI时代别慌报班：先把AI接进日常再说 →