AI 实力进阶:SOTA 模型格局解析
近期在使用 claude 4.8 探讨信息安全议题时,偶尔会遭遇模型拒答的情况。其给出的解释是自身能力过于强劲,因而增设了额外的安全防护机制,这有时会导致误判并错误地拒绝回答。
如此自信甚至略带自夸的模型,我尚属首次见识。但细想之下也能释然,毕竟 claude 的实力确实不容小觑。
所谓 SOTA 模型,即 state of the art,我可将其译为前沿大模型,它们与后续的其他模型之间已拉开了显著差距。
SOTA 阵营即所谓的“御三家”:claude、openai 和 gemini。实际体验下来,三者各有千秋:claude 在编码与文学创作上表现优异;openai 功能全面且文生图能力独步天下,唯独中文表达爱用“黑话”(不过从 opus4.7 版本起,claude 也染上了这个习惯);gemini 则在文学领域最为出色,不仅无“黑话”且情感丰富,但在其他方面稍显逊色。
除“御三家”外,seedance 也值得关注。鉴于 openai 因算力紧张(连巨头自身的显卡都捉襟见肘)已基本放弃该赛道,字节跳动在此领域已稳居绝对龙头地位。
紧随其后的是第二梯队。xai 如今已无人问津,除尺度较大外乏善可陈,购置了大量算力卡却不知在忙些什么。至于各类国产模型,为避免得罪人,此处便不作评述。
若条件允许,务必首选 SOTA 模型。因为当前 AI 整体实力仍显不足,即便是 SOTA 也尚未达到完美,更遑论那些与 SOTA 差距日益扩大的二线模型。倘若你的任务无需动用 SOTA,那只能说明该任务过于简单,或许根本无需借助 AI。