AI行业动态速递：模型进展、硬件革新与应用落地

发布时间：2026-04-28 08:51阅读：16

🔔1、小米发布VLA大模型训练流程，赋能机器人实现微米级精准操作

💡核心要点：小米公布了Xiaomi-Robotics-0 VLA大模型的完整训练流程，该模型在精细操作和空间感知能力上达到亚毫米级别，大大降低了机器人研发的门槛，有助于加速技术从理论走向实际应用，支持家庭及工业等多种复杂场景下的机器人部署。

📌查看原文

🔔2、DeepSeek v4 Flash支持本地运行，2bit量化GGUF实现高效推理

💡核心要点：DeepSeek v4 Flash现已支持在本地设备上进行推理，采用2比特选择性量化GGUF格式，能够在普通个人电脑上流畅运行，这是首次实现前沿大模型的高效本地部署。在大幅压缩模型体积的同时，其性能依然保持可用，显著降低了开发者的使用成本，丰富了本地部署的选择，并加速了端侧大模型生态的成熟。

📌查看原文

🔔3、DeepSeek-V4价格大幅下调，输入缓存成本降至原有十分之一

💡核心要点：DeepSeek-V4全系列模型的输入缓存命中价格已降至发布价的1/10。其中，Flash版本每百万token输入价格为0.02元，Pro版本为0.025元，这叠加了此前Pro版本输入价格75%的降幅，优惠活动将持续至5月5日。此举预示着Token缓存价格战的开启，旨在吸引用户从Claude、GPT等平台迁移，降低中小型团队使用顶级大模型的经济负担。

📌查看原文

🔔4、英伟达软件更新，GB200吞吐性能提升2.8倍，优化MoE模型推理

💡核心要点：英伟达Blackwell架构的推理栈迎来了重要升级，使得GB200在运行MoE模型时，单GPU吞吐量在三个月内提升了2.8倍。此次升级引入了NVFP4四比特浮点格式，并对预填充和解码调度进行了优化。TensorRT-LLM也同步进行了优化，这意味着现有显卡用户无需更换硬件即可获得显著的性能提升，有效缓解了通信瓶颈，为高密度推理场景提供了有力支持。

📌查看原文

🔔5、OpenAI携手联发科、高通，计划推出定制芯片AI手机

💡核心要点：据郭明錤透露，OpenAI正与联发科和高通合作研发定制手机芯片，并由立讯精密独家负责设计与制造。该计划旨在推出AI手机，通过AI智能体来取代传统的应用程序，预计在2028年实现量产，目标是瞄准高端市场。此举意在突破现有系统权限的限制，打造软硬一体化的AI终端，并重塑移动交互的生态格局。

📌查看原文

🔔6、阿里千问HappyHorse 1.0视频模型开启灰测，实现音画同步的统一架构

💡核心要点：阿里ATH团队发布了HappyHorse 1.0视频生成模型，该模型拥有150亿参数，采用统一的Transformer架构，实现了文本到视频和图像到视频的一体化生成。它支持1080p分辨率、多种画面比例以及按需设定的时长。生成的画面连贯性强，影视风格还原度高，目前已开放灰度测试，非常适合广告、电商和短剧等场景，并提供了亲民的包月定价方案。

📌查看原文

🔔7、微软发布TRELLIS.2大模型，支持高保真图像生成3D资产

💡核心要点：微软推出了TRELLIS.2，一个拥有40亿参数的3D生成模型。该模型采用了O-Voxel无场稀疏体素结构，能够生成高精度且带有PBR材质的3D资产，其拓扑结构完整且细节清晰锐利。目前，该模型的代码和论文已开源，并提供在线体验，旨在降低游戏、电商和虚拟拍摄等领域3D内容的生产门槛。

📌查看原文

🔔8、蚂蚁灵光App上线移动端世界模型，图片瞬间转化为3D交互场景

💡核心要点：灵光App现已上线“体验世界模型”功能，这是业界首个在移动端应用的世界模型。用户只需上传一张图片，即可在几秒钟内生成最长60秒的3D场景，并支持通过摇杆进行第一人称探索。该功能基于LingBot-World-Fast模型，实现了低延迟的流式传输，测试场景的连贯性良好且无穿模现象，有望普及专业级的AI 3D体验。

📌查看原文

🔔9、百度GenFlow 4.0升级，Office智能体月活跃用户突破一亿

💡核心要点：百度文库与网盘联合推出的GenFlow 4.0通用智能体已完成升级，其意图理解和记忆中心能力得到增强。PPT、Excel和Word三大Agent能够通过自然语言进行排版生成，月活跃用户已突破一亿，月度任务量达到2亿次。该系统深度兼容OpenClaw，支持多端协作，并且即将推出团队版本，能够显著缩短办公工作流程所需的时间。

📌查看原文

🔔10、荣耀YOYO安卓版率先集成DeepSeek-V4大模型

💡核心要点：荣耀YOYO智能助理成为安卓阵营中首个集成DeepSeek-V4大模型的助手。此次集成优化了其上下文理解和复杂指令处理能力，推理效率和逻辑思维能力得到显著提升，为用户提供了更流畅、更精准的交互体验，并推动了终端侧AI助手的整体能力升级。

📌查看原文

🔔11、OpenAI Codex正式整合入GPT-5.5架构，编程能力成为原生集成

💡核心要点：OpenAI调整了其战略方向，将Codex编程模型完全整合进GPT-5.5的核心架构。这意味着编程能力从之前的插件式转变为原生全能型，能够更有效地优化复杂编程任务的资源利用率，并降低开发者的使用成本。此举标志着编程能力已成为通用大模型的基础能力，AI编程工具也由此进入了一体化发展的新阶段。

📌查看原文

🔔12、小红书公布AI治理原则，严禁侵权造假并统一内容标识

💡核心要点：小红书首次发布了其AI治理主张，倡导合规使用AI进行创作，坚决抵制虚假信息、侵权行为和仿冒内容。同时，要求用户对AI生成的内容进行明确标识，否则平台将统一进行标记。平台将持续加强AI内容的识别和治理能力，并已开通申诉通道，以维护社区的真实性和透明度。

📌查看原文

🔔13、Anthropic首款AI桌面宠物Buddy问世，硬件由深圳制造

💡核心要点：Anthropic推出了名为Claude Buddy的桌面宠物AI。其硬件部分采用深圳M5Stack的M5StickC Plus，搭载ESP32芯片，并通过蓝牙与电脑连接，能够显示状态信息和提供一键审批功能，内置18种ASCII形象。得益于深圳的供应链优势，该产品的成本仅为海外同类产品的1/3到1/4，进一步完善了AI硬件的生态系统。

📌查看原文

🔔1、PaperClaw：科研AI辅助系统

💡功能亮点：该系统是专为学术研究人员设计的高性能AI自动化辅助工具。它采用了“大脑LLM决策引擎+手脚Skill插件执行层+记忆知识管理”的三层架构，能够一键启动，覆盖从文献发现到同行评审的整个科研流程。系统具备三层记忆机制、多模型路由、超过5700个可扩展的科研技能以及多Agent协作能力。它支持本地化私有部署以保障数据安全，并通过多层机制确保研究的合规性和可复现性。

📌链接地址:https://github.com/1692775560/PaperClaw

🔔2、HermesClaw：解决Hermes Agent与OpenClaw在同一微信账户下冲突问题

💡功能亮点：此工具解决了Hermes Agent和OpenClaw在同一微信账户下无法同时运行的问题。它充当唯一的iLink轮询器，并为每个代理运行独立的本地代理服务器。用户可以通过命令在两种AI代理之间切换，或同时接收它们的回复。这是一个轻量级的Python代理，通过转发原始协议消息来避免媒体处理的复杂性，并提供了一键安装功能，同时优化了消息分割问题。

📌链接地址:https://github.com/AaronWong1999/hermesclaw

💡论文摘要:我们荣幸地发布了DeepSeek-V4系列模型的预览版本，其中包括两款强大的混合专家（MoE）语言模型：拥有1.6万亿参数的DeepSeek-V4-Pro和拥有2840亿参数的DeepSeek-V4-Flash。这两款模型均支持高达一百万token的上下文长度。DeepSeek-V4系列在架构和优化方面集成了多项关键性的升级。我们使用了超过32万亿个多样化且高质量的token对这两款模型进行了预训练，并随后进行了一个全面的后训练流程，以充分释放并进一步提升其性能。

📌 链接地址：https://arxiv.org/abs/deepseek-v4

🔔2026-赛迪：关于具身智能产业创新发展趋势与路径的研究报告

💡报告摘要:

📌链接地址：请关注微信公众号【AGI前沿社】，并回复【2026具身发展报告】即可下载全文。

资讯

← 上一篇：珠海高新区AI机器人产业加速成势下一篇：溧水区第三小学：AI赋能，智慧课堂革新教研模式 →