代码段_标签-酷阅新闻

AI写代码这么强，为何却0分？

不信你们把这两条放到一起看看，确实挺“魔幻”的：第一条：OpenAI总裁表示，AI生成代码的表现从20%一路冲到80%。第二条：Meta上线的测试显示，顶级AI模型在这套评测里全都0分。一个是80%，一个是0%。而且这两个数字就出在同一周。是不是看着就很矛盾？我第一反应也一样：AI到底行不行？到底发生了什么？今天咱们就把这事儿讲清楚。建议你先收藏一下，这篇可能会把你对AI编程的认知重新洗一遍。先把测试到底在测什么说明白。Meta联合斯坦福、哈佛做了个新评测，名字叫ProgramBench。和以往的思路不一

2026-05-09 20:16:09 | 15 阅读