AI虽强，短板何在?

发布时间：2026-05-06 18:35阅读：15

越是喧嚣，越需冷静剖析，探究其短板所在，方能找准发力方向。

今儿咱们不谈别的，先聚焦文本模型。缘由有二：其一，文字是思维的最佳载体，门槛虽低但上限极高；其二，在语言文字能力上，即便当前最强AI也难言超越人类，不像图像生成，GPT-Image-2这类模型用下来，个人感觉已全面碾压我们了（比如本章正文靠人写，插图全是GPT-Image-2生成的）。

想必不少朋友早已知晓“大模型本质是概率猜词器”，但考虑到读者背景各异，我仍愿花点笔墨讲清其原理。

简而言之，AI生成语句时的核心动作，便是：依据过往所有文字，推测下一个词的极大概率为何。起点即是你给出的Prompt，它先猜首字最可能的取值，从中择取概率最高的填入，继而在此基础上续猜下一个，再下一个。

既然是连续猜词，为何输出如此有条理，不像乱猜？因为它遍历了互联网数万亿句，构建了庞大的“词频关联图谱”。当你输入“今天天气真……”，它一算，后续接“好”的概率28%，接“热”17%，接“糟糕”4%……于是从这些概率差异中随机抽取一词输出。

或许你觉得这有些随意，但确实行之有效，尤其是在它通读了全网文本之后。

但它的致命弱点也同样明显：全流程缺乏“真/假”的判断介入，仅有“高概率搭配”与“低概率搭配”之分。故而，一旦用户质疑，它便即刻改口，因这种输出与那种输出仅是概率高低之别，并无真伪标签。

若觉晦涩，记住一点：AI写文章，就是基于前文内容，不断计算下一个词出现的概率。

其实，日常闲聊时，人偶尔回像AI：打游戏时大脑过载，女友问话，我也会从高概率回复池中随机挑一个作答。

但撰写重要文字时，逻辑便成了主导。比如写此文，我脑中先有一个模糊的非语言念头——观点、情绪或主张。

此时运用的非概率，而是逻辑。我会在脑中推演观点：

“核心论点A，成立前提是B和C。B较通俗，略过；C隐蔽，常被误认为D——这才是症结。文章重心应放在厘清C与D的差异，只要这块立住了，全文观点便稳了。”

这背后是因果链、证据链及预设反驳。逻辑立住，文章便有了骨架纲目，字句随之从骨架中生发，而非顺着统计概率滑行。

更关键的是，人类有“推敲”本能：写一句，退一步审视其是否精准承载脑中“非语言念头”。若表达不准，便删改重写，哪怕新词统计上更冷门也无妨。

这正是为何人类表达可生硬、可奇特、有棱角——我们追求的是将心中“念头”精准传递。

AI没有需重点捍卫的“念头”。它只有前文提示，无心中观点主张，故亦无来回推敲。

因底层机制差异及逻辑推理缺失，AI常在以下方面翻车。

其一，缺乏现实世界的真实认知。

缺乏常识已闹过多次笑话，如离家50米洗车店，应开车还是步行，它选步行。此类无需讨论的常识，AI常显愚钝。它知“水烫”因语料共现，不知被烫缩手、蒸汽扑面之感。

故而描写具体、微妙、具身体感内容时，AI易飘——堆砌套话浮词，难出动人细节。

其二，无法产生鲜明观点。

如前所述，AI是概率机，输出无100%或0%判定，无法跨越相关到因果的鸿沟。遇开放问题，只能归纳正反，无法像人般排除干扰，收敛至明确判断。

故知乎受AI冲击远小于预期。

其三，无法带来强启发性。

AI总选概率最大词生成，答案多在概率分布中间，即“正确废话”。

人类认知提升机制不同，具启发性、破局的思想多在正态分布边缘两侧。那些极小概率的灵光、反直觉洞察、打破常规脑洞，正是AI追求“最大概率”时主动过滤的“噪音”。

我们需要的剑走偏锋策略、不按套路情节、跳出常态抉择……这些三倍标准差外的灵感，目前仍只能源于人脑。

现AI本质是语言重组器。以惊人速度，将人类已知知识经验重新排列组合。

但切记，因无真假判断力，它尚不能探索新知、提出新观念。不能从无到有构建新逻辑体系，不能在孤绝中做出离经叛道之举，更不能因内心痛苦、愤怒或对美的渴望，写出打动众人的新故事。

人类探索未知，始于感性冲动，成于理性逻辑。因困惑求真，因不公反抗，因意义匮乏创造叙事。这种从无到有、混沌中辟新序的能力，概率模型永远无法“喂养”出来。

故将重组归AI，探索归人，方为真正的“人剑合一”。