AI亲手制造了关于自身的恐慌：数据中心崩盘论竟是模型的幻觉

发布时间：2026-06-20 14:06阅读：1

SemiAnalysis——这家在半导体与 AI 基础设施领域颇具话语权的研究机构——发布了一份报告，核心观点非常明确："2026 年美国半数数据中心取消"这一令市场恐慌的论调，是 AI 自己虚构出来的。

这不是夸大其词，更非断章取义。实际情况是，AI 工具大规模抓取了未经证实的新闻稿，再借助模型生成结论，结论又被媒体二次放大，最终演变成一条令整个行业惶恐不安的"事实"。

这件事要追溯到 4 月 1 日。彭博社发布了一篇报道，引用了 Sightline Climate 的统计数据：2026 年美国 12GW 规划的数据中心产能中，仅有 5GW 已开工建设——其余的，"半数延期或取消"。

这一数字迅速扩散。科技媒体配上了更夸张的标题，社交平台上疯狂转发，投资者陷入恐慌，算力相关股票暴跌。

但 SemiAnalysis 进行了深度核查。

他们借助卫星视觉模型独立验证——仅仅是美国前两大超大规模云厂商的自建在建产能，就已经超过了 5GW。Sightline 所统计的所谓"12GW 规划产能"，仅涵盖了公开披露的大型标杆项目，完全没有纳入行业整体的开发管线。

换言之，"半数取消"这一结论，问题出在分母上——取消的项目确实存在——而分母只统计了那些高调宣布的早期项目，这些项目本身就极易跳票。

用一堆 PPT 项目作为分母，得出的延期率自然骇人。

但真正让我感到不安的，并非统计口径的问题，而是 SemiAnalysis 报告中的另一段内容：

大量所谓的产能预测模型仅依赖 AI 工具抓取新闻稿，将未经核实的 GW 级项目公告视为既定事实，完全忽视了实际建设工期、电网接入、审批流程等关键变量。

读到这里，我停顿了一下。

梳理一下这条链路：开发商发布一篇新闻稿，称"我们计划建设 500MW 数据中心"——AI 工具抓取到这条新闻稿——模型将其视为已确认产能——然后基于这些"已确认产能"计算出延期率——媒体据此撰写出"半数数据中心取消"的报道——投资者看到后陷入恐慌。

整个过程中，没有任何人去核实那篇新闻稿的真实可靠性。

这与 AI 在对话中信口开河不同。对话中杜撰一篇不存在的论文，至多让人尴尬。但此次，AI 的幻觉从聊天窗口溢出，渗透进了金融市场的定价模型、投资者的决策流程，甚至股价之中。

SemiAnalysis 将市场恐慌归咎于三类"无效噪音"。

第一类，地方建设暂停政策。截至 2026 年 4 月，美国已有 12 个州出台了管控法案。听起来令人担忧？但 SemiAnalysis 指出，这些法案仅针对早期规划项目，不涉及 2026 年核心交付产能。缅因州的禁令涉及的规划产能——不足 5MW。5MW 是怎样的规模？连一个中型数据中心的零头都不到。

第二类，早期投机性项目延期。行业新进入者，规划方案激进，交付时间脱离实际。这些项目从未进入实质落地阶段，但 AI 工具将其视为"已确认产能"纳入统计。

第三类，成熟项目的节奏偏差。开发商低估了设备交付、天气施工、机电调试等变量。以 Nebius 新泽西园区为例，首期 50MW 原计划 4 个月完工，最终耗时 10 个月。这是延期吗？确实是。但这是"行业崩溃"吗？显然不是。这不过是大型基建的正常节奏。

这三类噪音，单独来看都不构成系统性风险。但 AI 将其混合，再配上一个夸张的标题，就炮制出了"半数数据中心取消"的论调。

我一直在思考该如何描述这件事。它不仅仅是"AI 幻觉"——幻觉是 AI 凭空捏造了一个不存在的事物。此次情况更为严峻：AI 将真实但无关紧要的信息，通过错误的组合与放大，炮制出了一个虚假的叙事。

这一叙事并非凭空捏造——延期是事实，政策管控是事实，项目取消也是事实。但"半数取消"的结论是错误的，因为分母有误，权重失衡，因果链断裂。

最具讽刺意味的是：这个虚假叙事的主题，恰好是"AI 行业即将崩溃"——AI 亲手制造了一个关于自身的虚假恐慌。

这不是递归，而是死循环。

这才是我真正想表达的。

SemiAnalysis 的报告揭示的，不仅是数据中心行业的一个统计谬误。它揭示了一个更深层的隐患：当 AI 成为信息生产的主力，其偏差与幻觉不仅出现在对话中，更已开始扭曲现实世界的决策。

审视当下的信息生产链路：新闻稿→AI 抓取→AI 生成分析→媒体引用→投资者决策。这条链路中，核实的环节在哪里？

已经消失了。

人类分析师会致电开发商询问"你们这个项目到底开工了没有"，会查阅审批记录，会查看卫星图像。AI 不会。AI 只会抓取文本、运行模型、输出结论。速度提升了 100 倍，但准确率——无从知晓。

Kamiwaza AI 今年 3 月发布了一项研究，用 1720 亿词元测试了 35 个开源大模型的幻觉率。结果显示：表现最佳的模型在 32K 上下文下，编造率为 1.19%；而在 200K 上下文下，所有模型的编造率均超过 10%。哥伦比亚新闻评论的测试更为惊人——八个 AI 搜索工具在新闻引用查询中的错误率超过 60%。

60%。超过一半的引用是错误的。

当这些错误从"聊天窗口"渗透到"投资决策"中，会产生怎样的后果？

我尝试将这条链路梳理清晰：

AI 工具抓取未核实信息 → 模型生成错误结论 → 媒体二次放大 → 投资者基于错误信息做出决策 → 市场价格偏离基本面 → 更多 AI 工具抓取偏离的价格数据 → 生成更悲观的结论

这是一个正反馈回路。每循环一次，偏差就被放大一次。

SemiAnalysis 表示，过去六个月，他们对 2026 年北美超大规模自建数据中心产能的预测调整幅度仅为 1%。1%。而市场在恐慌什么？在恐慌一个 50% 的延期率。

1% 与 50% 之间，相差 49 个百分点。这 49 个百分点，正是 AI 制造的叙事泡沫的厚度。

你或许会说，数据中心延期与我何干。

但请思考这条逻辑的终点。若 AI 能够制造一个关于数据中心行业的虚假恐慌，它同样能够制造关于任何行业的虚假恐慌。医疗、教育、房地产、就业——任何拥有大量公开数据但核实成本高昂的领域，都可能成为 AI 叙事泡沫的温床。

2026 年下半年，大概率会出现一起因 AI 生成的虚假行业报告导致错误投资决策的重大事件。这并非预测，而是概率。当信息生产的主力从人类转变为 AI，而核实环节未能同步跟进，出事只是时间问题。

"AI 信息可信度"将成为新的监管议题。核心问题已不是该不该监管，而是如何有效监管。

SemiAnalysis 这份报告最大的价值，不在于它纠正了一个统计谬误——而在于它首次完整呈现了从 AI 幻觉到市场幻觉的因果链条。过去我们仅看到 AI 在对话中胡言乱语，如今我们看到其胡言乱语的后果切实影响了现实世界。

AI 最大的风险，并非它不够聪慧，而是它不够诚实——而我们尚未学会辨别真伪。

← 上一篇：AI 助力新高考：跨学科解题能力培养指南下一篇：AI消费时代悄然来临 →