标签

Anthropic重磅研究:AI生物智能体遭遇滑铁卢

2026年6月8日,Anthropic在官方Research栏目发了一篇由gget工具作者Laura Luebbert领衔的新文章。配套抛出一个叫VirBench的benchmark,把市面上叫得上名号的AI以及生物Agent全部拉到擂台上鞭了一遍——Claude Sonnet 4、Claude Opus 4.7、Biomni、Edison Analysis、GPT-5.2-pro、GPT-5.5,一个不落。测试任务听起来很简单:从NCBI Virus数据库里检索符合条件的病毒序列,120道真实题目,覆盖

2026-06-09 10:29:55  |  1 阅读