告别等待时代：前OpenAI高管推出革命性AI交互模型

发布时间：2026-05-12 21:31阅读：15

在OpenAI前CTO Mira Murati沉寂18个月之后，她创立的Thinking Machines公司终于在2026年5月11日发布了首款产品。

此次亮相的并非为刷榜而生的超大模型，也不是所谓的"GPT-5终结者"，而是一款名为Interaction Model的全新交互模型。

这段演示视频中有个令人震撼的细节：人工智能不再被动等待用户说完，而是像真人一样边听边看边思考，甚至在发现错误时会主动"打断"你。

要理解为何Thinking Machines让硅谷为之振奋，首先要认清一个现实：当前所有AI交互本质上都是"回合制"的。

无论是ChatGPT还是Claude，它们的基础逻辑就像二战时期的对讲机：

这种"停顿-处理-回应"的模式将AI局限在"工具"层面。而Thinking Machines推出的TML-Interaction-Small彻底打破了这一限制。

技术核心突破：200毫秒"微交互"（Micro-turns）

Thinking Machines摒弃了传统"你说完我再回应"的模式，将交互过程分解为每200毫秒的极小微单元。AI在连续时间轴上并行处理输入与输出。

独特观点：这不是改进，而是重构。这意味着AI具备了"并行处理能力"。当你编写代码时，它不会等你写完才提示错误，而是在你下笔瞬间就察觉逻辑问题并及时提醒。

为平衡响应速度与智能水平，Thinking Machines设计了巧妙的"双模型"架构：

1. 交互模型（Interaction Model）：

采用2760亿参数（120亿激活参数）的MoE架构。如同人类大脑皮层，负责实时语音、视觉流管理，确保0.4秒内的极低延迟。

2. 背景模型（Background Model）：

这是一个异步"隐形助手"。当交互模型判断需要复杂逻辑、网络搜索或工具调用时，会将任务转给背景模型。背景模型完成计算后，交互模型会在适当时机自然地将其融入对话。

这种机制解决了终极矛盾：AI要么很聪明但反应慢（推理模型），要么反应快但缺乏深度（小模型）。Thinking Machines让AI像人一样，可以边聊天边进行复杂运算。

视频中最令人惊叹的演示并非对话功能，而是视觉感知的实时表现。

用户做俯卧撑时，AI在旁计数；在实验室做化学实验时，AI观察试剂颜色变化，主动提醒："颜色变深了，现在该加催化剂了。"

这种"视觉主动性"（Visual Proactivity）标志着AI从"被动应答者"进化为"主动观察者"。

当OpenAI和Anthropic都在追求"智能上限"时，Mira Murati选择突破"交互带宽"。

这背后有一个极其深刻的洞察：

"如果人与AI的沟通速度只有56K猫的速度，那么AI智商是140还是1000其实毫无区别。"

Thinking Machines正在解决AI落地的最后难题——协作障碍。当AI能听懂语气、看懂手势、并实时修正答案时，它才真正具备成为"超级个体"副驾驶的资格。

Thinking Machines的发布预示着AI竞争重心的转移。

过去我们比谁更博学，未来我们比谁更"拟人化"。当AI不再让你"等待"，而是让你感觉它就坐在对面注视着屏幕和动作时，图灵测试的最后一道防线也就瓦解了。

这就是Mira Murati沉寂18个月后带来的答案：智能不应该是冰冷的对话框，而应是流动的协作流。

互动话题：

如果AI能像真人一样随时打断你纠正错误，你觉得它是贴心助手还是冒犯的"监工"？欢迎评论区交流。