标签

AI行业动态速递:模型进展、硬件革新与应用落地

发布时间:2026-04-28 08:51来源:微信阅读:5

🔔1、小米发布VLA大模型训练流程,赋能机器人实现微米级精准操作

💡核心要点:小米公布了Xiaomi-Robotics-0 VLA大模型的完整训练流程,该模型在精细操作和空间感知能力上达到亚毫米级别,大大降低了机器人研发的门槛,有助于加速技术从理论走向实际应用,支持家庭及工业等多种复杂场景下的机器人部署。

📌查看原文

🔔2、DeepSeek v4 Flash支持本地运行,2bit量化GGUF实现高效推理

💡核心要点:DeepSeek v4 Flash现已支持在本地设备上进行推理,采用2比特选择性量化GGUF格式,能够在普通个人电脑上流畅运行,这是首次实现前沿大模型的高效本地部署。在大幅压缩模型体积的同时,其性能依然保持可用,显著降低了开发者的使用成本,丰富了本地部署的选择,并加速了端侧大模型生态的成熟。

📌查看原文

🔔3、DeepSeek-V4价格大幅下调,输入缓存成本降至原有十分之一

💡核心要点:DeepSeek-V4全系列模型的输入缓存命中价格已降至发布价的1/10。其中,Flash版本每百万token输入价格为0.02元,Pro版本为0.025元,这叠加了此前Pro版本输入价格75%的降幅,优惠活动将持续至5月5日。此举预示着Token缓存价格战的开启,旨在吸引用户从Claude、GPT等平台迁移,降低中小型团队使用顶级大模型的经济负担。

📌查看原文

🔔4、英伟达软件更新,GB200吞吐性能提升2.8倍,优化MoE模型推理

💡核心要点:英伟达Blackwell架构的推理栈迎来了重要升级,使得GB200在运行MoE模型时,单GPU吞吐量在三个月内提升了2.8倍。此次升级引入了NVFP4四比特浮点格式,并对预填充和解码调度进行了优化。TensorRT-LLM也同步进行了优化,这意味着现有显卡用户无需更换硬件即可获得显著的性能提升,有效缓解了通信瓶颈,为高密度推理场景提供了有力支持。

📌查看原文

🔔5、OpenAI携手联发科、高通,计划推出定制芯片AI手机

💡核心要点:据郭明錤透露,OpenAI正与联发科和高通合作研发定制手机芯片,并由立讯精密独家负责设计与制造。该计划旨在推出AI手机,通过AI智能体来取代传统的应用程序,预计在2028年实现量产,目标是瞄准高端市场。此举意在突破现有系统权限的限制,打造软硬一体化的AI终端,并重塑移动交互的生态格局。

📌查看原文

🔔6、阿里千问HappyHorse 1.0视频模型开启灰测,实现音画同步的统一架构

💡核心要点:阿里ATH团队发布了HappyHorse 1.0视频生成模型,该模型拥有150亿参数,采用统一的Transformer架构,实现了文本到视频和图像到视频的一体化生成。它支持1080p分辨率、多种画面比例以及按需设定的时长。生成的画面连贯性强,影视风格还原度高,目前已开放灰度测试,非常适合广告、电商和短剧等场景,并提供了亲民的包月定价方案。

📌查看原文

🔔7、微软发布TRELLIS.2大模型,支持高保真图像生成3D资产

💡核心要点:微软推出了TRELLIS.2,一个拥有40亿参数的3D生成模型。该模型采用了O-Voxel无场稀疏体素结构,能够生成高精度且带有PBR材质的3D资产,其拓扑结构完整且细节清晰锐利。目前,该模型的代码和论文已开源,并提供在线体验,旨在降低游戏、电商和虚拟拍摄等领域3D内容的生产门槛。

📌查看原文

🔔8、蚂蚁灵光App上线移动端世界模型,图片瞬间转化为3D交互场景

💡核心要点:灵光App现已上线“体验世界模型”功能,这是业界首个在移动端应用的世界模型。用户只需上传一张图片,即可在几秒钟内生成最长60秒的3D场景,并支持通过摇杆进行第一人称探索。该功能基于LingBot-World-Fast模型,实现了低延迟的流式传输,测试场景的连贯性良好且无穿模现象,有望普及专业级的AI 3D体验。

📌查看原文

🔔9、百度GenFlow 4.0升级,Office智能体月活跃用户突破一亿

💡核心要点:百度文库与网盘联合推出的GenFlow 4.0通用智能体已完成升级,其意图理解和记忆中心能力得到增强。PPT、Excel和Word三大Agent能够通过自然语言进行排版生成,月活跃用户已突破一亿,月度任务量达到2亿次。该系统深度兼容OpenClaw,支持多端协作,并且即将推出团队版本,能够显著缩短办公工作流程所需的时间。

📌查看原文

🔔10、荣耀YOYO安卓版率先集成DeepSeek-V4大模型

💡核心要点:荣耀YOYO智能助理成为安卓阵营中首个集成DeepSeek-V4大模型的助手。此次集成优化了其上下文理解和复杂指令处理能力,推理效率和逻辑思维能力得到显著提升,为用户提供了更流畅、更精准的交互体验,并推动了终端侧AI助手的整体能力升级。

📌查看原文

🔔11、OpenAI Codex正式整合入GPT-5.5架构,编程能力成为原生集成

💡核心要点:OpenAI调整了其战略方向,将Codex编程模型完全整合进GPT-5.5的核心架构。这意味着编程能力从之前的插件式转变为原生全能型,能够更有效地优化复杂编程任务的资源利用率,并降低开发者的使用成本。此举标志着编程能力已成为通用大模型的基础能力,AI编程工具也由此进入了一体化发展的新阶段。

📌查看原文

🔔12、小红书公布AI治理原则,严禁侵权造假并统一内容标识

💡核心要点:小红书首次发布了其AI治理主张,倡导合规使用AI进行创作,坚决抵制虚假信息、侵权行为和仿冒内容。同时,要求用户对AI生成的内容进行明确标识,否则平台将统一进行标记。平台将持续加强AI内容的识别和治理能力,并已开通申诉通道,以维护社区的真实性和透明度。

📌查看原文

🔔13、Anthropic首款AI桌面宠物Buddy问世,硬件由深圳制造

💡核心要点:Anthropic推出了名为Claude Buddy的桌面宠物AI。其硬件部分采用深圳M5Stack的M5StickC Plus,搭载ESP32芯片,并通过蓝牙与电脑连接,能够显示状态信息和提供一键审批功能,内置18种ASCII形象。得益于深圳的供应链优势,该产品的成本仅为海外同类产品的1/3到1/4,进一步完善了AI硬件的生态系统。

📌查看原文

🔔1、PaperClaw:科研AI辅助系统

💡功能亮点:该系统是专为学术研究人员设计的高性能AI自动化辅助工具。它采用了“大脑LLM决策引擎+手脚Skill插件执行层+记忆知识管理”的三层架构,能够一键启动,覆盖从文献发现到同行评审的整个科研流程。系统具备三层记忆机制、多模型路由、超过5700个可扩展的科研技能以及多Agent协作能力。它支持本地化私有部署以保障数据安全,并通过多层机制确保研究的合规性和可复现性。

📌链接地址:https://github.com/1692775560/PaperClaw

🔔2、HermesClaw:解决Hermes Agent与OpenClaw在同一微信账户下冲突问题

💡功能亮点:此工具解决了Hermes Agent和OpenClaw在同一微信账户下无法同时运行的问题。它充当唯一的iLink轮询器,并为每个代理运行独立的本地代理服务器。用户可以通过命令在两种AI代理之间切换,或同时接收它们的回复。这是一个轻量级的Python代理,通过转发原始协议消息来避免媒体处理的复杂性,并提供了一键安装功能,同时优化了消息分割问题。

📌链接地址:https://github.com/AaronWong1999/hermesclaw

💡论文摘要:我们荣幸地发布了DeepSeek-V4系列模型的预览版本,其中包括两款强大的混合专家(MoE)语言模型:拥有1.6万亿参数的DeepSeek-V4-Pro和拥有2840亿参数的DeepSeek-V4-Flash。这两款模型均支持高达一百万token的上下文长度。DeepSeek-V4系列在架构和优化方面集成了多项关键性的升级。我们使用了超过32万亿个多样化且高质量的token对这两款模型进行了预训练,并随后进行了一个全面的后训练流程,以充分释放并进一步提升其性能。

📌 链接地址:https://arxiv.org/abs/deepseek-v4

🔔2026-赛迪:关于具身智能产业创新发展趋势与路径的研究报告

💡报告摘要:

📌链接地址:请关注微信公众号【AGI前沿社】,并回复【2026具身发展报告】即可下载全文。

资讯