2026 年 6 月 10 日 arXiv 人工智能前沿论文汇总
1. PhantomBench:评估语言模型面对不存事实的幻觉风险 原文标题:PhantomBench: Benchmarking the Non-existential Threat of Language Models 发布时间:2026-06-09 论文链接:http://arxiv.org/abs/2606.11105v1 语言模型(LMs)产生违背事实的响应(即幻觉)构成了严峻挑战,极易引发用户的盲目信赖。此种隐患在医疗、司法等关键领域尤为致命,模型的误判可能招致严重后果。尽管学界在解析幻觉成因