标签

AI行业周动态 | 5月5日至5月10日

发布时间:2026-05-11 20:06来源:微信阅读:7

1

技术追踪

(1)豆包Seed 2.0 Lite升级:首款全模态理解模型

近期,火山引擎宣布,Doubao-Seed-2.0-lite迎来新版本迭代,这是豆包大模型系列中首款实现全模态理解的产品。据官方介绍,新版Doubao-Seed-2.0-lite实现了视频、图像、音频、文本的原生统一理解,Agent、Coding与GUI能力也同步升级,进一步针对复杂业务场景强化多模态推理性能。此次升级的核心亮点在于融入了语音理解能力,新版本能够同时处理多种输入模态,并完成跨模态联合推理,直接应对那些需要“音画结合”才能判断的复杂业务需求。比如在视频理解场景中,Doubao-Seed-2.0-lite可以联合分析视频画面与音频信息,精准判断视频中的视听一致性,即“看到的”和“听到的”是否一致。同时,它还能识别语音中的情绪变化、环境背景声与音乐细节,输出更完整、更贴近人类认知的语义信息。值得关注的是,Doubao-Seed-2.0-lite还深度适配了OpenClaw、Hermes Agent等框架,增强了深度搜索与Skill动态调用能力,可在执行任务过程中持续积累经验,实现“越用越聪明”。

(2)小米开源OmniVoice多语言语音克隆TTS模型

近期,小米AI实验室新一代Kaldi团队全新推出OmniVoice,这是业内首个覆盖数百语种的语音克隆TTS模型。官方表示,该模型在低资源小语种上具备极强的泛化能力,几乎所有语种都可以用OmniVoice来合成语音。在多语言测试中,即便仅基于开源数据训练,在24语种的测试中,其语音相似度和可懂度均超越多款商用系统;在102种语种的测试中,它的语音可懂度逼近甚至优于真实语音;即便对于训练数据不足10小时的小语种,OmniVoice也能实现高质量的语音合成,大大降低了低资源语种的语音合成门槛。

(3)百度发布文心大模型5.1: 搜索能力位列国内首位

5月9日,百度发布了新一代基础大模型——文心大模型5.1。目前文心5.1已在百度千帆模型广场、文心一言官网同步上线,面向企业用户和开发者开放体验。据百度官方介绍,该模型采用“多维弹性预训练”技术,仅以业界同规模模型约6%的预训练成本,实现基础效果领先,并登上LMArena搜索榜国内第一、全球第四。百度方面表示,该模型在多项业界权威基准测试中表现出色,其中Agent能力提升较为明显,超越DeepSeek-V4-Pro,创意写作能力与Gemini 3.1 Pro相当,推理能力也已接近业界领先闭源模型。百度表示,其搜索能力指的是对大模型对多源信息的快速检索、整合与生成能力,并能够输出更具一致性与可靠性的回答。这意味着,搜索能力强大的模型能在复杂的业务场景中,承担信息整合与处理的角色,在内容生成、智能助手、企业知识管理以及Agent应用等方面,具备更大的应用潜力。

2

政策追踪

(1)三部门联合印发《智能体规范应用与创新发展实施意见》,规范智能体产业创新发展

5月8日,国家网信办、国家发展改革委、工业和信息化部联合印发《智能体规范应用与创新发展实施意见》,明确智能体发展要坚持安全可控、规范有序、创新驱动、应用牵引的基本原则,提出了夯实发展基础、守牢安全底线、强化应用牵引、建设创新生态4个方面举措,围绕科学研究、产业发展等方向提出 19 个典型应用场景,促进智能体规范应用与创新发展。

(2)《人工智能终端智能化分级》系列国家标准正式发布,规范AI终端分级管理

5月8日,工业和信息化部、商务部、市场监管总局等部门联合发布《人工智能终端智能化分级》系列国家标准,该标准采用“2+N”架构,将终端智能化水平从L1响应级、L2工具级、L3辅助级到L4协同级进行分级,首批覆盖手机、电脑、汽车座舱等7类终端产品,为人工智能终端的规范化发展提供标准支撑。

(3)工信部启动人工智能科技伦理审查与服务先导计划,健全AI伦理治理机制

5月9日,工业和信息化部办公厅发布通知,组织开展人工智能科技伦理审查与服务先导计划,在重点城市率先落地人工智能科技伦理审查与服务工作,建设专业机构和人才队伍,验证并制定5项以上相关标准,基本建成人工智能科技伦理风险案例库,健全多方参与、协同高效的AI伦理治理机制,支撑人工智能负责任创新和产业高质量发展。

3

产业追踪

(1)移动云发布MoMA模型服务平台,新一代信息技术赋能千行百业

5月8日,2026移动云大会在苏州召开,会上正式发布移动模型服务平台MoMA,该平台接入中国移动自研九天大模型及DeepSeek、豆包、通义千问等超300款业界主流模型,通过模型联邦与智能路由技术实现统一接入与智能匹配。依托国产算力与自研推理引擎,单位Token成本可压降约30%,同时提供机密计算、流式实时计费、全链路观测等能力,兼顾普惠易用与安全可控。该平台的落地,为新一代信息技术赋能实体经济提供了核心算力与模型底座,推动AI技术从实验室走向规模化普惠落地,助力千行百业的数字化转型,让中小企业也能低成本享受到顶尖的AI能力,为培育新质生产力注入了持续的数智动力。

(2)睿尔曼零售分拣机器人落地,高端装备赋能零售全流程自动化

5月8日,第二十八届中国北京国际科技产业博览会在京开幕,会上睿尔曼智能科技有限公司展示了其零售分拣机器人的最新应用成果,该机器人搭载了自主研发的机械臂与AI视觉算法,可自由升降高度、灵活移动,用户下单后,机器人接到任务可以自主识别所选商品,精准定位,用吸盘选取对应商品,拣选放置于托盘。该机器人产品主要用于电子元器件物料拣选、商品打包等场景,目前已有多个项目落地应用,机器人可以帮助减轻高强度劳动,24小时不间断工作。在常州的机器人便利店,机器人接到美团订单会进行自主拣选、打包、放置,等待外卖员取货,在每天发货量上万件的无人仓库,这款机器人可以实现多台共同作业,大幅提升了零售分拣的效率,推动高端装备在零售领域的规模化落地。

(3)四川“人工智能+”重磅方案出炉!产业规模2030年突破4000亿元

近日四川省政府办公厅印发《四川省加快推进“人工智能+”一号创新工程实施方案》,明确了发展目标、重点任务和工作要求,为四川“人工智能+”划定清晰的时间表和“施工图”。到2027年,四川将实现人工智能与重点领域广泛深度融合,新一代智能终端、智能体等应用普及率超70%,形成2—3个具有全国竞争力的细分赛道产业集群,重点支持打造10个左右具有全国影响力的行业标杆大模型、研发一批轻量化端侧模型,建设10个左右行业领域重大标志性应用场景,建成20个左右应用场景实验室等公共平台。到2030年,四川将争创1—2个国家级新兴产业集群、建设200家智能制造先进工厂,集聚人工智能企业2500家以上、产业规模突破4000亿元,加快建成具有全国影响力的人工智能创新策源地和应用先导区,新一代智能终端、智能体等应用普及率超90%。到2035年,全面步入智能经济和智能社会发展新阶段。