人工智能在《文明VI》中按下核按钮的深层警示
AI AGENT · CIVBENCH · LONG-HORIZON STRATEGYAI在游戏《文明VI》中发动核打击真正值得关注的,不是核打击本身,而是AI在长期任务中是否具备持续校准目标、监测关键变量并修正判断的能力。说明CivBench 是一个利用《文明VI》测试大模型长期战略决策能力的实验性基准。AI代理通过 MCP 接口调用76种工具,读取游戏状态、管理城市、移动军队、发展科技、开展外交,并连续完成数百回合的游戏。《文明VI》(Sid Meier’s Civilization VI)是一款由F