AI 实力进阶：SOTA 模型格局解析

发布时间：2026-06-03 21:20阅读：21

近期在使用 claude 4.8 探讨信息安全议题时，偶尔会遭遇模型拒答的情况。其给出的解释是自身能力过于强劲，因而增设了额外的安全防护机制，这有时会导致误判并错误地拒绝回答。

如此自信甚至略带自夸的模型，我尚属首次见识。但细想之下也能释然，毕竟 claude 的实力确实不容小觑。

所谓 SOTA 模型，即 state of the art，我可将其译为前沿大模型，它们与后续的其他模型之间已拉开了显著差距。

SOTA 阵营即所谓的“御三家”：claude、openai 和 gemini。实际体验下来，三者各有千秋：claude 在编码与文学创作上表现优异；openai 功能全面且文生图能力独步天下，唯独中文表达爱用“黑话”（不过从 opus4.7 版本起，claude 也染上了这个习惯）；gemini 则在文学领域最为出色，不仅无“黑话”且情感丰富，但在其他方面稍显逊色。

除“御三家”外，seedance 也值得关注。鉴于 openai 因算力紧张（连巨头自身的显卡都捉襟见肘）已基本放弃该赛道，字节跳动在此领域已稳居绝对龙头地位。

紧随其后的是第二梯队。xai 如今已无人问津，除尺度较大外乏善可陈，购置了大量算力卡却不知在忙些什么。至于各类国产模型，为避免得罪人，此处便不作评述。

若条件允许，务必首选 SOTA 模型。因为当前 AI 整体实力仍显不足，即便是 SOTA 也尚未达到完美，更遑论那些与 SOTA 差距日益扩大的二线模型。倘若你的任务无需动用 SOTA，那只能说明该任务过于简单，或许根本无需借助 AI。

← 上一篇：零基础上手AI Agent：打造你的专属智能体下一篇：微信AI智能体重磅来袭，张小龙重塑数字交互 →