AI前沿速递:Grok 4.3发布,AI助手新篇章
时间:2026-05-04 08:09 · 收录 10 条 AI 动态 · 核心:xAI、人工智能、前沿科技
xAI 推出了 Grok 4.3 模型,定位为实用性的过渡版本。该模型 API 价格下调了 40%-60%,推理速度达到 196 Tokens/s,并支持高达 100 万 Token 的长上下文。在代理任务和办公自动化方面能力显著增强,尤其擅长生成文档、表格及演示文稿。然而,在 Intelligence Index 评比中,它落后于 GPT-5.5 和 Claude Opus 4.7,复杂推理和事实核查的稳定性有待提高,同时幻觉率有所上升。
• 更多信息:https://mp.weixin.qq.com/s/-ewhh9yqowqFdieLSecrJA
OpenAI 的编程助手 Codex 引入了“宠物模式”,允许用户在桌面上饲养一个“赛博桌宠”。通过输入 /pet 命令即可激活电子宠物,它能实时显示 Codex 的工作状态(如运行中、等待输入、可复核)并提供进度提示。用户无需打开应用即可了解工作进展。此外,还可以通过 hatch-pet 技能定制专属的宠物外观。
• 更多信息:https://www.ithome.com/0/945/989.htm
百度智能云推出了集成的 AI 短剧创作平台 Hogee,用户只需上传剧本或输入创意,AI 即可自动生成角色、场景及分镜视频,覆盖从文本到成片的完整流程。该平台支持 .txt、.docx、.pdf 等五种格式的剧本导入,并集成了 OpenClaw 数字员工矩阵,可提供社交媒体运营、营销素材制作及数据分析等服务。
• 更多信息:https://ai-bot.cn/hogee/
DeepSeek 在 GitHub 上公开了其多模态大模型及相关技术报告,提出了一种“基于视觉原语的思考”框架。该框架将点、边界框等空间标记视为推理的“基本思维单元”,赋予模型精确的空间指代和推演能力,克服了传统链式思维在复杂空间参照任务中的局限。模型结构精巧,视觉标记效率高,在计数和空间推理基准测试中表现可与 GPT-5.4、Claude-Sonnet-4.6 等先进模型媲美。
• 更多信息:https://www.ithome.com/0/945/740.htm
阿里通义开源了大模型可解释性工具套件 Qwen-Scope,该工具基于稀疏自编码器(SAE)技术,支持 Qwen3 和 Qwen3.5 系列共 7 款模型。Qwen-Scope 能够在推理阶段精确控制输出结果,利用少量种子数据完成数据分类和长尾样本生成,并能定位异常特征以优化语言混用和重复生成等问题。
• 更多信息:https://mp.weixin.qq.com/s/3y3cjMJG070RmqZReE6j2A
限时免费体验:https://gzh.yijiayun.com
美国国防部宣布已与 SpaceX、OpenAI、谷歌、英伟达、Reflection、微软及亚马逊云(AWS)等 7 家顶尖 AI 公司达成协议,旨在加速美军向“人工智能主导”的作战力量转型,提升其在所有战争领域的决策优势。此举标志着美军正式将先进民用 AI 技术深度整合进国防体系,推动 AI 在军事指挥、情报分析和作战决策等方面的广泛应用。
• 更多信息:https://mp.weixin.qq.com/s/huUEz1pjnhjeQpwSmalblg
马斯克与奥特曼的世纪庭审引发了诸多关注……
马斯克方面,公开承认 xAI 在训练 Grok 时“蒸馏”了 OpenAI 的模型。
他在庭审中,上午刚表示“不对人大喊”,下午就当庭大声争辩。
律师 Savitt 追问捐款情况:承诺的 10 亿美元,仅到账 3800 万美元,兑现率不足 4%。
马斯克表示:“没有我,OpenAI 就不会存在!我贡献了我的声誉!我给这个公司起了名字!这些都是有价值的!”
随后他被迫承认:“严格从货币角度来说,我确实捐了 3800 万美元。”
• 更多信息:https://www.qbitai.com/2026/05/412080.html
劳动节期间,一个接近百岁的“老古董”级大模型也迎来了“工作”。
是的,有人将仅拥有 1930 年知识的模型,通过微调,使其成为了一个软件工程师……
整个过程比预想的要轻松,仅用了 250 个训练样本,这位“强悍的老头”就解决了自己遇到的第一个编程难题——
一个从未见过电视机的 AI,如今也开始“学坏”,要和程序员争夺饭碗了(开玩笑)。
这款模型叫做 talkie-1930-13b,近期因其“老头 AI”的身份而备受关注。
• 更多信息:https://www.qbitai.com/2026/05/412896.html
清华 AIR DISCOVER Lab 投稿
具身智能领域正经历一场由视觉驱动的感知范式转型。
视觉作为机器人感知世界时信息密度最高、且与自然人机交互最契合的模态,是实现通用机器人智能和仿真到真实无缝迁移的关键。
• 更多信息:https://www.qbitai.com/2026/05/412870.html
DeepSeekV4 的技术报告中提到了 mHC、CSA、HCA、Muon 和 FP4 等技术点。
Engram 模型,由 DeepSeek 和北大联合于今年 1 月开源,主要聚焦于大模型的记忆与效率问题。
自 Engram 发布以来,在业内引发了广泛讨论…
这不仅因为它预示着 V4 模型的到来,更因为它解决了“伦敦是英国首都”这类事实性信息,模型无需动用整个深层网络重新推导,可以直接查询获取。
• 更多信息:https://www.qbitai.com/2026/05/412737.html