AI写代码这么强,为何却0分?
不信你们把这两条放到一起看看,确实挺“魔幻”的:第一条:OpenAI总裁表示,AI生成代码的表现从20%一路冲到80%。第二条:Meta上线的测试显示,顶级AI模型在这套评测里全都0分。一个是80%,一个是0%。而且这两个数字就出在同一周。是不是看着就很矛盾?我第一反应也一样:AI到底行不行?到底发生了什么?今天咱们就把这事儿讲清楚。建议你先收藏一下,这篇可能会把你对AI编程的认知重新洗一遍。先把测试到底在测什么说明白。Meta联合斯坦福、哈佛做了个新评测,名字叫ProgramBench。和以往的思路不一