标签

告别等待时代:前OpenAI高管推出革命性AI交互模型

发布时间:2026-05-12 21:31来源:微信阅读:5

在OpenAI前CTO Mira Murati沉寂18个月之后,她创立的Thinking Machines公司终于在2026年5月11日发布了首款产品。

此次亮相的并非为刷榜而生的超大模型,也不是所谓的"GPT-5终结者",而是一款名为Interaction Model的全新交互模型。

这段演示视频中有个令人震撼的细节:人工智能不再被动等待用户说完,而是像真人一样边听边看边思考,甚至在发现错误时会主动"打断"你。

要理解为何Thinking Machines让硅谷为之振奋,首先要认清一个现实:当前所有AI交互本质上都是"回合制"的。

无论是ChatGPT还是Claude,它们的基础逻辑就像二战时期的对讲机:

这种"停顿-处理-回应"的模式将AI局限在"工具"层面。而Thinking Machines推出的TML-Interaction-Small彻底打破了这一限制。

技术核心突破:200毫秒"微交互"(Micro-turns)

Thinking Machines摒弃了传统"你说完我再回应"的模式,将交互过程分解为每200毫秒的极小微单元。AI在连续时间轴上并行处理输入与输出。

独特观点:这不是改进,而是重构。这意味着AI具备了"并行处理能力"。当你编写代码时,它不会等你写完才提示错误,而是在你下笔瞬间就察觉逻辑问题并及时提醒。

为平衡响应速度与智能水平,Thinking Machines设计了巧妙的"双模型"架构:

1. 交互模型(Interaction Model):

采用2760亿参数(120亿激活参数)的MoE架构。如同人类大脑皮层,负责实时语音、视觉流管理,确保0.4秒内的极低延迟。

2. 背景模型(Background Model):

这是一个异步"隐形助手"。当交互模型判断需要复杂逻辑、网络搜索或工具调用时,会将任务转给背景模型。背景模型完成计算后,交互模型会在适当时机自然地将其融入对话。

这种机制解决了终极矛盾:AI要么很聪明但反应慢(推理模型),要么反应快但缺乏深度(小模型)。Thinking Machines让AI像人一样,可以边聊天边进行复杂运算。

视频中最令人惊叹的演示并非对话功能,而是视觉感知的实时表现。

用户做俯卧撑时,AI在旁计数;在实验室做化学实验时,AI观察试剂颜色变化,主动提醒:"颜色变深了,现在该加催化剂了。"

这种"视觉主动性"(Visual Proactivity)标志着AI从"被动应答者"进化为"主动观察者"。

当OpenAI和Anthropic都在追求"智能上限"时,Mira Murati选择突破"交互带宽"。

这背后有一个极其深刻的洞察:

"如果人与AI的沟通速度只有56K猫的速度,那么AI智商是140还是1000其实毫无区别。"

Thinking Machines正在解决AI落地的最后难题——协作障碍。当AI能听懂语气、看懂手势、并实时修正答案时,它才真正具备成为"超级个体"副驾驶的资格。

Thinking Machines的发布预示着AI竞争重心的转移。

过去我们比谁更博学,未来我们比谁更"拟人化"。当AI不再让你"等待",而是让你感觉它就坐在对面注视着屏幕和动作时,图灵测试的最后一道防线也就瓦解了。

这就是Mira Murati沉寂18个月后带来的答案:智能不应该是冰冷的对话框,而应是流动的协作流。

互动话题:

如果AI能像真人一样随时打断你纠正错误,你觉得它是贴心助手还是冒犯的"监工"?欢迎评论区交流。