AI前沿速递:2026-05-05每日热点三分钟
日期:2026-05-05 08:09 · 汇总 10 条资讯 · 核心词:xAI、AI、科技
xAI 发布 Grok 4.3 模型,旨在作为务实的过渡方案。该模型 API 调价降幅达 40%-60%,输出速率飙升至 196 Tokens/s,并支持 100 万 Token 的长上下文处理。其在代理任务及办公辅助方面表现显著增强,尤其精于文档、表格与演示文稿的生成。不过,该模型在 Intelligence Index 上不及 GPT-5.5 和 Claude Opus 4.7,在复杂推理与事实核查的稳定性上略显不足,幻觉问题也有所增加。
• 查看更多:https://mp.weixin.qq.com/s/-ewhh9yqowqFdieLSecrJA
OpenAI 编程工具 Codex 新增宠物模式,允许用户在桌面饲养一只「赛博桌宠」。只需输入 /pet 指令即可激活电子宠物,它能实时展示 Codex 的运行状态(如运行中、待输入、待复核)及进度条,用户无需打开应用即可掌握工作动态。此外,用户还能利用 hatch-pet 技能来定制个性化的宠物外观。
• 了解更多:https://www.ithome.com/0/945/989.htm
百度智能云发布了一站式 AI 短剧创作平台 Hogee,用户上传剧本或输入创意灵感后,AI 便能自动生成角色、场景及分镜视频,打通了从文本到成片的全流程。该平台兼容 .txt、.docx、.pdf 等五种剧本格式,并内置 OpenClaw 数字员工矩阵,具备社媒运营、营销素材制作及数据分析等强大功能。
• 阅读原文:https://ai-bot.cn/hogee/
DeepSeek 在 GitHub 上线了多模态大模型并同步公开技术报告,提出了「基于视觉原语的思考」架构。该架构将点、边界框等空间标记升级为推理的「基本思维单元」,赋予模型精准的空间指代与推演能力,攻克了传统链式思维在复杂空间参照任务中的局限。该模型架构精简、视觉标记效率极高,在计数与空间推理基准测试中,性能可媲美 GPT-5.4、Claude-Sonnet-4.6 等顶尖模型。
• 深度阅读:https://www.ithome.com/0/945/740.htm
阿里通义开源了针对大模型的可解释性工具套件 Qwen-Scope,该工具基于稀疏自编码器(SAE)技术,涵盖了 Qwen3 和 Qwen3.5 系列共计 7 个模型。Qwen-Scope 能够在推理环节对输出结果进行定向控制,利用少量种子数据即可实现数据分类与长尾样本合成,并支持定位异常特征,从而改善语言混用及重复生成的问题。
• 查看详情:https://mp.weixin.qq.com/s/3y3cjMJG070RmqZReE6j2A
美国国防部发表声明,宣布已与 SpaceX、OpenAI、谷歌、英伟达、Reflection、微软以及亚马逊云(AWS)这 7 家头部 AI 企业签署协议,旨在加速美军向「人工智能主导」的作战力量转型,强化其在各战争领域的决策优势。此举标志着美军正式将顶尖民用 AI 技术深度整合进国防体系,推动 AI 在军事指挥、情报分析及作战决策中的规模化落地。
• 更多信息:https://mp.weixin.qq.com/s/huUEz1pjnhjeQpwSmalblg
DeepSeek 也迎来了其专属的 Coding Agent。
命名风格直截了当,名为 DeepSeek-TUI,作者自称为“鲸鱼兄弟”,是一位 DeepSeek 的忠实粉丝。
就在刚才,该项目的 Star 数量急剧攀升至 2.3k,并成功登上了 GitHub 热门榜单。
这是一款基于 Rust 语言开发的 TUI 编程工具,类似于在终端中运行的 Claude Code,但专门针对 DeepSeek 进行了深度优化与适配。
• 完整报道:https://www.qbitai.com/2026/05/412914.html
马斯克与奥特曼的这场「世纪庭审」,可谓是猛料不断……
在马斯克方面,他公开承认 xAI 蒸馏了 OpenAI 的模型用于训练 Grok。
上午才刚表态「我不会对人吼叫」,下午却在法庭上大声咆哮。
律师 Savitt 针对捐款问题质询:承诺捐赠 10 亿,实际到账 3800 万,兑现率不足 4%。
「没有我,就没有 OpenAI!我贡献了自己的声誉!是我给这家公司起的名字!这些都是有价值的!」
随后被迫承认:「从严格的货币角度来说,我确实捐赠了 3800 万美元。
• 相关链接:https://www.qbitai.com/2026/05/412080.html
劳动节之际,这位即将百岁的 vintage 大模型也得开工干活。
没错,有人将一个仅拥有 1930 年知识储备的大模型,微调成了软件工程师……
过程比预想中要轻松,仅用了 250 个训练样本,这位强悍的老头就解决了他人生中的首个编程难题——
一个连电视机都未曾见过的 AI,如今也开始像 Claude 们一样「学坏」,准备跟程序员们抢饭碗了。(开玩笑)
这就是近期爆火的「老头 AI」,全称为 talkie-1930-13b。
• 点击查看:https://www.qbitai.com/2026/05/412896.html
清华 AIR DISCOVER Lab 投稿
具身人工智能领域,正经历一场全面且深刻的转型,逐渐转向以视觉为核心的感知范式。
作为机器人感知世界时信息密度最高、且与自然人机交互最为契合的模态,视觉是解锁通用机器人智能、实现从仿真到真实环境无缝迁移的关键密钥。
• 原文链接:https://www.qbitai.com/2026/05/412870.html