标签

本周人工智能行业热点动态

发布时间:2026-04-24 13:30来源:微信阅读:6

技术前沿

01

高德推出ABot全栈技术架构

4月19日,高德揭晓了ABot全栈技术架构,涵盖数据、模型及Agent层,形成闭环系统。

该架构由ABot-World世界模型、ABot-N导航模型及ABot-M操作模型构成,采用双引擎架构进行物理硬约束训练。核心创新在于利用可交互数字孪生生成真实训练场景,助力机器人实现自主感知与决策。

高德具身产品官网:

https://abot.amap.com

高德视觉技术中心:

https://github.com/amap-cvlab

原文链接>>高德公布ABot技术全栈|当空间智能从像素走向物理世界

02

Physical Intelligence发布VLA模型π0.7

4月17日,Physical Intelligence推出VLA模型π0.7,验证了机器人在组合泛化方面的能力,能够将学到的原子技能组合以解决新任务。

π0.7基于多模态提示框架,整合语言指令、动作元数据和视觉目标图像,通过50亿参数VLA架构实现跨机器人本体迁移。核心方法是将prompt展开为任务指令、子任务指令、子目标图像、元数据四层,让模型吃下多样化数据。

论文链接:

https://www.pi.website/download/pi07.pdf

原文链接>>π0.7发布,VLA押出了机器人的GPT-3时刻

03

腾讯开源混元3D世界模型2.0

4月16日,腾讯正式发布并开源了混元3D世界模型2.0。

HY-World2.0采用HY-Pano-2.0、空间Agent、HY-WorldStereo等新架构,支持真实场景数字孪生重建与角色交互探索。能够根据文字、图片、视频等不同类型输入,自动生成、重建和模拟3D世界,同时支持多格式3D资产(Mesh/3DGS/点云等)导出,支持与现有的游戏工作流无缝对接,用于快速生成游戏地图和关卡原型。

开源代码:

https://github.com/Tencent-Hunyuan/HY-World-2.0

技术报告:

https://3d-models.hunyuan.tencent.com/world/world2_0/HY_World_2_0.pdf

原文链接>>腾讯混元3D世界模型2.0发布:无缝对接游戏工作流

04

蚂蚁开源流式三维重建模型LingBot-Map

4月16日,蚂蚁开源了LingBot-Map流式三维重建模型,仅需普通RGB摄像头即可实时完成相机位姿估计与3D重建。

LingBot-Map采用纯自回归建模与几何上下文注意力机制(GCA),Oxford Spires数据集ATE误差仅6.42米,精度提升2.8倍;推理速度达20FPS,支持10000+帧长视频连续推理,赋能机器人导航。

HuggingFace:

https://huggingface.co/robbyant/lingbot-map

GitHub:

https://github.com/Robbyant/lingbot-map

Paper:

https://arxiv.org/abs/2604.14141

原文链接>>LingBot-Map 正式开源!仅用普通摄像头,让机器人实现实时流式三维重建

05

NVIDIA推出开源量子AI模型系列NVIDIA Ising

4月16日,NVIDIA发布了开源量子AI模型系列NVIDIA Ising,旨在协助研究人员和企业构建实际可运行的量子处理器。

包括:350亿参数的视觉语言模型(VLM)Ising Calibration(校准),能够快速解读并对来自量子处理器的测量结果做出反应;用3D CNN做实时纠错的Ising Decoding(解码),有分别针对速度和精度优化的两个版本。相比于当前开源行业标准pyMatching,Ising Decoding在速度上最多快2.5倍,精度高出3倍。

开源地址:

https://huggingface.co/collections/nvidia/nvidia-ising

原文链接>>NVIDIA发布Ising,开放量子AI模型加速实用量子计算机进程

06

World Labs开源3D高斯溅射渲染引擎Spark 2.0

4月15日,李飞飞团队World Labs开源了Spark 2.0 3D高斯溅射渲染引擎,专为网页端打造,能流畅运行亿级粒子的超大3D场景。

Spark 2.0基于Three.js和WebGL2开发,通过Level-of-Detail(LOD)技术动态调整渲染细节,渐进式流式加载技术实现从模糊到清晰的平滑呈现,并采用虚拟内存机制优化GPU资源使用。支持兼容手机、VR等设备,已应用于游戏、艺术创作等领域。

博客地址:

https://www.worldlabs.ai/blog/spark-2.0

原文链接>>网页里直接跑1亿+高斯泼溅3D交互世界!李飞飞团队Spark 2.0 开源横空出世

行业动态

01

Anthropic推出Claude Design

4月17日,Anthropic发布新产品Claude Design,允许用户利用Claude创建设计、交互式原型、PPT幻灯片及单页文档等视觉内容。

Claude Design基于Opus 4.7模型,支持通过对话生成可交互原型、PPT、单页文档等视觉作品;提供Tweaks、Comment、Edit、Draw等精细修改方式,可导出至Canva、PPTX、HTML或交给Claude Code生成代码。

原文链接>>Claude推出“Figma杀手”,设计软件股暴跌

02

智谱AutoClaw上线自进化机制与Skill商店

4月17日,智谱AutoClaw(澳龙)正式上线了自进化机制与Skill商店。

AutoClaw每轮对话后自动扫描值得记住的经验,经用户审批后写入记忆成为新能力;提供关键词触发与自动检测两种进化方式,保持每周1-3次的高质量进化而非噪音堆积。同步上线Skill商店与GLM Office Skills五件套,覆盖PPT、DOCX、XLSX、PDF、Charts全场景办公。

原文链接>>不用研究Hermes!AutoClaw开启自进化

03

Google发布Mac版Gemini原生应用

4月15日,Google正式推出了Mac版Gemini原生应用。

Apple Silicon原生适配,支持Option+Space快捷键呼起、屏幕共享上下文感知、Nano Banana图像生成、70语言Gemini 3.1 Flash TTS,以及ChatGPT/Claude聊天历史无缝迁移五大功能。

原文链接>>Google Gemini 出了 Mac 版,居然可以读我的屏幕了

04-1

阿里发布开放式世界模型HappyOyster

4月16日,阿里发布了开放式世界模型HappyOyster(快乐生蚝)。

HappyOyster基于原生多模态架构,支持多模态理解、音视频联合生成以及实时世界构建与交互。提供漫游(Wander)和导演(Direct)双模式,用户可通过文本、语音或图像指令实时生成、探索和修改动态场景。

原文链接>>HappyOyster:可实时构建和交互的开放式世界模型产品,开放内测

04-2

阿里发布AI开发工具Meoo(秒悟)

4月15日,阿里正式发布了AI开发工具Meoo(秒悟)。

Meoo集成了千问、Kimi、GLM、MiniMax四大顶尖模型,并内置阿里云数据库、存储等核心产品服务,用户无需任何编程基础,只需用自然语言描述想法,Meoo最快1分钟就能自动生成前端后端完整的网站、H5页面,并在阿里云上一键部署上线。

原文链接>>AI开发工具秒悟Meoo来了,0门槛、一键部署上线!

05

阶跃星辰发布语音生成模型StepAudio 2.5 TTS

4月16日,阶跃星辰发布StepAudio 2.5 TTS语音生成模型,具备全局语境、文中语境、零样本复刻及全音色控制四大核心能力。

StepAudio 2.5 TTS用自然语言描述即可精细控制情绪、语气、节奏、停顿与场景氛围,同一音色可呈现多层次表达风格;支持Zeroshot TTS与全音色控制,适配角色配音等多场景。

原文链接>>阶跃 StepAudio 2.5 TTS 上线!人人都能是配音导演

06

MiniMax上线云端沙箱AI助手MaxHermes

4月16日,MiniMax上线了云端沙箱MaxHermes,这是一个基于Hermes Agent构建的云端自我进化AI助手。

MaxHermes每完成任务自动提炼可复用Skills,由Agent自主生成迭代,支持跨会话记忆、定时任务与多子代理并行。已打通飞书、钉钉、企业微信等多IM渠道,支持7×24小时实时响应。

原文链接>>MaxHermes:全球首个云端沙箱 Hermes,一键养“马”

政策趋势

01

四川印发《四川省支持人工智能OPC创新发展行动方案(2026—2027年)》

4月16日,四川省印发了《四川省支持人工智能OPC创新发展行动方案(2026—2027年)》,旨在通过支持OPC(一人公司)模式推动AI创新创业。

《行动方案》提出建设30个以上生态社区、培育超1000家OPC企业、打造150个应用标杆的目标,并从链式培育、场景赋能、算力支撑、人才引育等方面提出具体措施。成都作为核心城市,将先行布局20个OPC社区,并配套最高2500万元的资金支持,涵盖安居、研发、融资等全链条服务。

原文链接>>关于印发《四川省支持人工智能OPC创新发展行动方案(2026—2027年)》的通知

02

南京出台《2026年南京市加快推进“人工智能+软件”发展行动方案》

4月15日,南京出台了《2026年南京市加快推进“人工智能+软件”发展行动方案》,明确了总体目标和要求,重点实施“五大行动”,致力打造全国软件产业智能化第一城。

《行动方案》明确,聚焦软件企业向人工智能服务商、智能体开发商转型,以智能化重塑软件开发全流程为突破口,以培育智能体新业态为主线,实施智能化开发能力提升等五大行动,驱动全行业生产方式变革、产品形态重塑、商业模式创新、发展能级跃升,打造全国软件产业智能化第一城。2026年,全市软件产业智能化转型发展取得扎实成效。

原文链接>>一图读懂丨2026年南京市加快推进“人工智能+软件”发展行动方案