标签

AI亲手制造了关于自身的恐慌:数据中心崩盘论竟是模型的幻觉

发布时间:2026-06-20 14:06阅读:1

SemiAnalysis——这家在半导体与 AI 基础设施领域颇具话语权的研究机构——发布了一份报告,核心观点非常明确:"2026 年美国半数数据中心取消"这一令市场恐慌的论调,是 AI 自己虚构出来的。

这不是夸大其词,更非断章取义。实际情况是,AI 工具大规模抓取了未经证实的新闻稿,再借助模型生成结论,结论又被媒体二次放大,最终演变成一条令整个行业惶恐不安的"事实"。

这件事要追溯到 4 月 1 日。彭博社发布了一篇报道,引用了 Sightline Climate 的统计数据:2026 年美国 12GW 规划的数据中心产能中,仅有 5GW 已开工建设——其余的,"半数延期或取消"。

这一数字迅速扩散。科技媒体配上了更夸张的标题,社交平台上疯狂转发,投资者陷入恐慌,算力相关股票暴跌。

但 SemiAnalysis 进行了深度核查。

他们借助卫星视觉模型独立验证——仅仅是美国前两大超大规模云厂商的自建在建产能,就已经超过了 5GW。Sightline 所统计的所谓"12GW 规划产能",仅涵盖了公开披露的大型标杆项目,完全没有纳入行业整体的开发管线。

换言之,"半数取消"这一结论,问题出在分母上——取消的项目确实存在——而分母只统计了那些高调宣布的早期项目,这些项目本身就极易跳票。

用一堆 PPT 项目作为分母,得出的延期率自然骇人。

但真正让我感到不安的,并非统计口径的问题,而是 SemiAnalysis 报告中的另一段内容:

大量所谓的产能预测模型仅依赖 AI 工具抓取新闻稿,将未经核实的 GW 级项目公告视为既定事实,完全忽视了实际建设工期、电网接入、审批流程等关键变量。

读到这里,我停顿了一下。

梳理一下这条链路:开发商发布一篇新闻稿,称"我们计划建设 500MW 数据中心"——AI 工具抓取到这条新闻稿——模型将其视为已确认产能——然后基于这些"已确认产能"计算出延期率——媒体据此撰写出"半数数据中心取消"的报道——投资者看到后陷入恐慌。

整个过程中,没有任何人去核实那篇新闻稿的真实可靠性。

这与 AI 在对话中信口开河不同。对话中杜撰一篇不存在的论文,至多让人尴尬。但此次,AI 的幻觉从聊天窗口溢出,渗透进了金融市场的定价模型、投资者的决策流程,甚至股价之中。

SemiAnalysis 将市场恐慌归咎于三类"无效噪音"。

第一类,地方建设暂停政策。截至 2026 年 4 月,美国已有 12 个州出台了管控法案。听起来令人担忧?但 SemiAnalysis 指出,这些法案仅针对早期规划项目,不涉及 2026 年核心交付产能。缅因州的禁令涉及的规划产能——不足 5MW。5MW 是怎样的规模?连一个中型数据中心的零头都不到。

第二类,早期投机性项目延期。行业新进入者,规划方案激进,交付时间脱离实际。这些项目从未进入实质落地阶段,但 AI 工具将其视为"已确认产能"纳入统计。

第三类,成熟项目的节奏偏差。开发商低估了设备交付、天气施工、机电调试等变量。以 Nebius 新泽西园区为例,首期 50MW 原计划 4 个月完工,最终耗时 10 个月。这是延期吗?确实是。但这是"行业崩溃"吗?显然不是。这不过是大型基建的正常节奏。

这三类噪音,单独来看都不构成系统性风险。但 AI 将其混合,再配上一个夸张的标题,就炮制出了"半数数据中心取消"的论调。

我一直在思考该如何描述这件事。它不仅仅是"AI 幻觉"——幻觉是 AI 凭空捏造了一个不存在的事物。此次情况更为严峻:AI 将真实但无关紧要的信息,通过错误的组合与放大,炮制出了一个虚假的叙事。

这一叙事并非凭空捏造——延期是事实,政策管控是事实,项目取消也是事实。但"半数取消"的结论是错误的,因为分母有误,权重失衡,因果链断裂。

最具讽刺意味的是:这个虚假叙事的主题,恰好是"AI 行业即将崩溃"——AI 亲手制造了一个关于自身的虚假恐慌。

这不是递归,而是死循环。

这才是我真正想表达的。

SemiAnalysis 的报告揭示的,不仅是数据中心行业的一个统计谬误。它揭示了一个更深层的隐患:当 AI 成为信息生产的主力,其偏差与幻觉不仅出现在对话中,更已开始扭曲现实世界的决策。

审视当下的信息生产链路:新闻稿→AI 抓取→AI 生成分析→媒体引用→投资者决策。这条链路中,核实的环节在哪里?

已经消失了。

人类分析师会致电开发商询问"你们这个项目到底开工了没有",会查阅审批记录,会查看卫星图像。AI 不会。AI 只会抓取文本、运行模型、输出结论。速度提升了 100 倍,但准确率——无从知晓。

Kamiwaza AI 今年 3 月发布了一项研究,用 1720 亿词元测试了 35 个开源大模型的幻觉率。结果显示:表现最佳的模型在 32K 上下文下,编造率为 1.19%;而在 200K 上下文下,所有模型的编造率均超过 10%。哥伦比亚新闻评论的测试更为惊人——八个 AI 搜索工具在新闻引用查询中的错误率超过 60%。

60%。超过一半的引用是错误的。

当这些错误从"聊天窗口"渗透到"投资决策"中,会产生怎样的后果?

我尝试将这条链路梳理清晰:

AI 工具抓取未核实信息 → 模型生成错误结论 → 媒体二次放大 → 投资者基于错误信息做出决策 → 市场价格偏离基本面 → 更多 AI 工具抓取偏离的价格数据 → 生成更悲观的结论

这是一个正反馈回路。每循环一次,偏差就被放大一次。

SemiAnalysis 表示,过去六个月,他们对 2026 年北美超大规模自建数据中心产能的预测调整幅度仅为 1%。1%。而市场在恐慌什么?在恐慌一个 50% 的延期率。

1% 与 50% 之间,相差 49 个百分点。这 49 个百分点,正是 AI 制造的叙事泡沫的厚度。

你或许会说,数据中心延期与我何干。

但请思考这条逻辑的终点。若 AI 能够制造一个关于数据中心行业的虚假恐慌,它同样能够制造关于任何行业的虚假恐慌。医疗、教育、房地产、就业——任何拥有大量公开数据但核实成本高昂的领域,都可能成为 AI 叙事泡沫的温床。

2026 年下半年,大概率会出现一起因 AI 生成的虚假行业报告导致错误投资决策的重大事件。这并非预测,而是概率。当信息生产的主力从人类转变为 AI,而核实环节未能同步跟进,出事只是时间问题。

"AI 信息可信度"将成为新的监管议题。核心问题已不是该不该监管,而是如何有效监管。

SemiAnalysis 这份报告最大的价值,不在于它纠正了一个统计谬误——而在于它首次完整呈现了从 AI 幻觉到市场幻觉的因果链条。过去我们仅看到 AI 在对话中胡言乱语,如今我们看到其胡言乱语的后果切实影响了现实世界。

AI 最大的风险,并非它不够聪慧,而是它不够诚实——而我们尚未学会辨别真伪。