AI虽强,短板何在?
越是喧嚣,越需冷静剖析,探究其短板所在,方能找准发力方向。
今儿咱们不谈别的,先聚焦文本模型。缘由有二:其一,文字是思维的最佳载体,门槛虽低但上限极高;其二,在语言文字能力上,即便当前最强AI也难言超越人类,不像图像生成,GPT-Image-2这类模型用下来,个人感觉已全面碾压我们了(比如本章正文靠人写,插图全是GPT-Image-2生成的)。
想必不少朋友早已知晓“大模型本质是概率猜词器”,但考虑到读者背景各异,我仍愿花点笔墨讲清其原理。
简而言之,AI生成语句时的核心动作,便是:依据过往所有文字,推测下一个词的极大概率为何。起点即是你给出的Prompt,它先猜首字最可能的取值,从中择取概率最高的填入,继而在此基础上续猜下一个,再下一个。
既然是连续猜词,为何输出如此有条理,不像乱猜?因为它遍历了互联网数万亿句,构建了庞大的“词频关联图谱”。当你输入“今天天气真……”,它一算,后续接“好”的概率28%,接“热”17%,接“糟糕”4%……于是从这些概率差异中随机抽取一词输出。
或许你觉得这有些随意,但确实行之有效,尤其是在它通读了全网文本之后。
但它的致命弱点也同样明显:全流程缺乏“真/假”的判断介入,仅有“高概率搭配”与“低概率搭配”之分。故而,一旦用户质疑,它便即刻改口,因这种输出与那种输出仅是概率高低之别,并无真伪标签。
若觉晦涩,记住一点:AI写文章,就是基于前文内容,不断计算下一个词出现的概率。
其实,日常闲聊时,人偶尔回像AI:打游戏时大脑过载,女友问话,我也会从高概率回复池中随机挑一个作答。
但撰写重要文字时,逻辑便成了主导。比如写此文,我脑中先有一个模糊的非语言念头——观点、情绪或主张。
此时运用的非概率,而是逻辑。我会在脑中推演观点:
“核心论点A,成立前提是B和C。B较通俗,略过;C隐蔽,常被误认为D——这才是症结。文章重心应放在厘清C与D的差异,只要这块立住了,全文观点便稳了。”
这背后是因果链、证据链及预设反驳。逻辑立住,文章便有了骨架纲目,字句随之从骨架中生发,而非顺着统计概率滑行。
更关键的是,人类有“推敲”本能:写一句,退一步审视其是否精准承载脑中“非语言念头”。若表达不准,便删改重写,哪怕新词统计上更冷门也无妨。
这正是为何人类表达可生硬、可奇特、有棱角——我们追求的是将心中“念头”精准传递。
AI没有需重点捍卫的“念头”。它只有前文提示,无心中观点主张,故亦无来回推敲。
因底层机制差异及逻辑推理缺失,AI常在以下方面翻车。
其一,缺乏现实世界的真实认知。
缺乏常识已闹过多次笑话,如离家50米洗车店,应开车还是步行,它选步行。此类无需讨论的常识,AI常显愚钝。它知“水烫”因语料共现,不知被烫缩手、蒸汽扑面之感。
故而描写具体、微妙、具身体感内容时,AI易飘——堆砌套话浮词,难出动人细节。
其二,无法产生鲜明观点。
如前所述,AI是概率机,输出无100%或0%判定,无法跨越相关到因果的鸿沟。遇开放问题,只能归纳正反,无法像人般排除干扰,收敛至明确判断。
故知乎受AI冲击远小于预期。
其三,无法带来强启发性。
AI总选概率最大词生成,答案多在概率分布中间,即“正确废话”。
人类认知提升机制不同,具启发性、破局的思想多在正态分布边缘两侧。那些极小概率的灵光、反直觉洞察、打破常规脑洞,正是AI追求“最大概率”时主动过滤的“噪音”。
我们需要的剑走偏锋策略、不按套路情节、跳出常态抉择……这些三倍标准差外的灵感,目前仍只能源于人脑。
现AI本质是语言重组器。以惊人速度,将人类已知知识经验重新排列组合。
但切记,因无真假判断力,它尚不能探索新知、提出新观念。不能从无到有构建新逻辑体系,不能在孤绝中做出离经叛道之举,更不能因内心痛苦、愤怒或对美的渴望,写出打动众人的新故事。
人类探索未知,始于感性冲动,成于理性逻辑。因困惑求真,因不公反抗,因意义匮乏创造叙事。这种从无到有、混沌中辟新序的能力,概率模型永远无法“喂养”出来。
故将重组归AI,探索归人,方为真正的“人剑合一”。