AI前沿速递：Grok 4.3发布，AI助手新篇章

发布时间：2026-05-04 08:26阅读：15

时间：2026-05-04 08:09 · 收录 10 条 AI 动态 · 核心：xAI、人工智能、前沿科技

xAI 推出了 Grok 4.3 模型，定位为实用性的过渡版本。该模型 API 价格下调了 40%-60%，推理速度达到 196 Tokens/s，并支持高达 100 万 Token 的长上下文。在代理任务和办公自动化方面能力显著增强，尤其擅长生成文档、表格及演示文稿。然而，在 Intelligence Index 评比中，它落后于 GPT-5.5 和 Claude Opus 4.7，复杂推理和事实核查的稳定性有待提高，同时幻觉率有所上升。

• 更多信息：https://mp.weixin.qq.com/s/-ewhh9yqowqFdieLSecrJA

OpenAI 的编程助手 Codex 引入了“宠物模式”，允许用户在桌面上饲养一个“赛博桌宠”。通过输入 /pet 命令即可激活电子宠物，它能实时显示 Codex 的工作状态（如运行中、等待输入、可复核）并提供进度提示。用户无需打开应用即可了解工作进展。此外，还可以通过 hatch-pet 技能定制专属的宠物外观。

• 更多信息：https://www.ithome.com/0/945/989.htm

百度智能云推出了集成的 AI 短剧创作平台 Hogee，用户只需上传剧本或输入创意，AI 即可自动生成角色、场景及分镜视频，覆盖从文本到成片的完整流程。该平台支持 .txt、.docx、.pdf 等五种格式的剧本导入，并集成了 OpenClaw 数字员工矩阵，可提供社交媒体运营、营销素材制作及数据分析等服务。

• 更多信息：https://ai-bot.cn/hogee/

DeepSeek 在 GitHub 上公开了其多模态大模型及相关技术报告，提出了一种“基于视觉原语的思考”框架。该框架将点、边界框等空间标记视为推理的“基本思维单元”，赋予模型精确的空间指代和推演能力，克服了传统链式思维在复杂空间参照任务中的局限。模型结构精巧，视觉标记效率高，在计数和空间推理基准测试中表现可与 GPT-5.4、Claude-Sonnet-4.6 等先进模型媲美。

• 更多信息：https://www.ithome.com/0/945/740.htm

阿里通义开源了大模型可解释性工具套件 Qwen-Scope，该工具基于稀疏自编码器（SAE）技术，支持 Qwen3 和 Qwen3.5 系列共 7 款模型。Qwen-Scope 能够在推理阶段精确控制输出结果，利用少量种子数据完成数据分类和长尾样本生成，并能定位异常特征以优化语言混用和重复生成等问题。

• 更多信息：https://mp.weixin.qq.com/s/3y3cjMJG070RmqZReE6j2A

限时免费体验：https://gzh.yijiayun.com

美国国防部宣布已与 SpaceX、OpenAI、谷歌、英伟达、Reflection、微软及亚马逊云（AWS）等 7 家顶尖 AI 公司达成协议，旨在加速美军向“人工智能主导”的作战力量转型，提升其在所有战争领域的决策优势。此举标志着美军正式将先进民用 AI 技术深度整合进国防体系，推动 AI 在军事指挥、情报分析和作战决策等方面的广泛应用。

• 更多信息：https://mp.weixin.qq.com/s/huUEz1pjnhjeQpwSmalblg

马斯克与奥特曼的世纪庭审引发了诸多关注……

马斯克方面，公开承认 xAI 在训练 Grok 时“蒸馏”了 OpenAI 的模型。

他在庭审中，上午刚表示“不对人大喊”，下午就当庭大声争辩。

律师 Savitt 追问捐款情况：承诺的 10 亿美元，仅到账 3800 万美元，兑现率不足 4%。

马斯克表示：“没有我，OpenAI 就不会存在！我贡献了我的声誉！我给这个公司起了名字！这些都是有价值的！”

随后他被迫承认：“严格从货币角度来说，我确实捐了 3800 万美元。”

• 更多信息：https://www.qbitai.com/2026/05/412080.html

劳动节期间，一个接近百岁的“老古董”级大模型也迎来了“工作”。

是的，有人将仅拥有 1930 年知识的模型，通过微调，使其成为了一个软件工程师……

整个过程比预想的要轻松，仅用了 250 个训练样本，这位“强悍的老头”就解决了自己遇到的第一个编程难题——

一个从未见过电视机的 AI，如今也开始“学坏”，要和程序员争夺饭碗了（开玩笑）。

这款模型叫做 talkie-1930-13b，近期因其“老头 AI”的身份而备受关注。

• 更多信息：https://www.qbitai.com/2026/05/412896.html

清华 AIR DISCOVER Lab 投稿

具身智能领域正经历一场由视觉驱动的感知范式转型。

视觉作为机器人感知世界时信息密度最高、且与自然人机交互最契合的模态，是实现通用机器人智能和仿真到真实无缝迁移的关键。

• 更多信息：https://www.qbitai.com/2026/05/412870.html

DeepSeekV4 的技术报告中提到了 mHC、CSA、HCA、Muon 和 FP4 等技术点。

Engram 模型，由 DeepSeek 和北大联合于今年 1 月开源，主要聚焦于大模型的记忆与效率问题。

自 Engram 发布以来，在业内引发了广泛讨论…

这不仅因为它预示着 V4 模型的到来，更因为它解决了“伦敦是英国首都”这类事实性信息，模型无需动用整个深层网络重新推导，可以直接查询获取。

• 更多信息：https://www.qbitai.com/2026/05/412737.html

← 上一篇：AI热点速览下一篇：AI行业周观察：4.27-5.3热点与趋势 →