顶级编程AI遭质疑"变笨":用户是否在为性能波动买单?
Claude Opus 4.6被公认为当前最顶尖的AI编程模型,同时也是价格最昂贵的。
然而近期,它正面临用户信任危机。
一、性能下降争议
开发者社区陆续有声音指出:Opus 4.6似乎变迟钝了。以往Claude能顺利攻克的难题,如今却频频出错。
两道经典测试题:
第一题:洗车店就在50米外,该步行还是驾车?常规思维是走路,但题目暗藏玄机——既然是去洗车,自然要开车前往才能享受服务。
第二题:父亲因女儿患红绿色盲而情绪崩溃,原因何在?此题设有逻辑陷阱,需吃透"红绿色盲"背后的前提条件。
Claude Opus 4.6近期在这两道题上栽了跟头。开发者社区瞬间哗然。
二、究竟是能力退化,还是正常波动?
AI模型输出存在天然随机性。但用户的顾虑同样合理:支付的是顶级费用,选用的是旗舰产品,理应获得稳定水准的表现。
三、订阅用户的普遍担忧
Claude Opus 4.6的订阅价格不菲。用户之所以买单,正是冲着其行业标杆的地位。但AI模型的能力并非一成不变——你只能选择相信官方,或干脆弃用。
四、这揭示了哪些深层问题?
AI产业存在严重的信息黑箱。训练数据、迭代周期、性能基准等关键信息,用户完全无法掌握。这种不透明在传统消费品领域极为罕见。
你认为AI的"性能起伏",理应向用户充分披露吗?