顶级编程AI遭质疑"变笨"：用户是否在为性能波动买单？

发布时间：2026-04-12 11:15阅读：14

Claude Opus 4.6被公认为当前最顶尖的AI编程模型，同时也是价格最昂贵的。

然而近期，它正面临用户信任危机。

一、性能下降争议

开发者社区陆续有声音指出：Opus 4.6似乎变迟钝了。以往Claude能顺利攻克的难题，如今却频频出错。

两道经典测试题：

第一题：洗车店就在50米外，该步行还是驾车？常规思维是走路，但题目暗藏玄机——既然是去洗车，自然要开车前往才能享受服务。

第二题：父亲因女儿患红绿色盲而情绪崩溃，原因何在？此题设有逻辑陷阱，需吃透"红绿色盲"背后的前提条件。

Claude Opus 4.6近期在这两道题上栽了跟头。开发者社区瞬间哗然。

二、究竟是能力退化，还是正常波动？

AI模型输出存在天然随机性。但用户的顾虑同样合理：支付的是顶级费用，选用的是旗舰产品，理应获得稳定水准的表现。

三、订阅用户的普遍担忧

Claude Opus 4.6的订阅价格不菲。用户之所以买单，正是冲着其行业标杆的地位。但AI模型的能力并非一成不变——你只能选择相信官方，或干脆弃用。

四、这揭示了哪些深层问题？

AI产业存在严重的信息黑箱。训练数据、迭代周期、性能基准等关键信息，用户完全无法掌握。这种不透明在传统消费品领域极为罕见。

你认为AI的"性能起伏"，理应向用户充分披露吗？