揭开AI的神秘面纱:它不是思考,是在玩文字接龙
你听完可能觉得这玩意儿太牛了,积攒了七十年力量爆发出来,这不得无敌。
但今天我要告诉你一件事,可能让你有点幻灭。
你打开DeepSeek或豆包,问它"帮我写一封辞职信,语气委婉点"。几秒钟,一封措辞得体、情真意切的信就出来了。你可能会想:这东西是不是真的理解我在想什么?它是不是懂"辞职"意味着什么,"委婉"的分寸在哪?
真正的答案是:No
事实上任何大语言模型根本不知道你在想什么,它只是在玩一场空前绝后的文字接龙游戏。知道这一点,可能比知道它有多强更重要。
所以我们讲一下这里的“接龙”两个字,到底是什么意思?
你给它四个字:床前明月。
它开始根据算法去算下一个该输出的字,在这个语境里概率最高的是什么"光",在前四个字的条件下,光字概率碾压其他所有字。
你再给它光。它继续记录在算法里,继续推算下一个字。下一个字大概率是"疑"。
就这样一个字一个字往下接。接出来就是:床前明月光,疑是地上霜。
你让它背一首诗,它接得你泪流满面。你觉得它懂了。
但它不是懂了,它是在推送出来见世面之前,它已经在训练本上见过几十亿次,每个字符的出现都是它通过概率不断推算的结果。
它这辈子干的事只有一个:把整个训练集的文本全部读完,然后在任何一句话后面,算出下一个最可能出现的字是什么。
所以现阶段大语言模型的输出内容,从本质上看,它根本不是理解,它完全不能理解你描述的语言是什么感觉,它只会计算,它的输出内容是概率、是接龙。
更通俗的说法是肌肉记忆。
你唱过一万遍的歌,音乐一响,就自己唱起来了,你没有在思考下一句是什么。AI就是这个状态。只是它的肌肉记忆来自训练人员输入的内容。
你让它写辞职信的时候,它在想的是:辞职信这三个字后面,整个互联网上最常出现的下一段话是什么。然后接出来一段看起来情真意切的东西。
情真意切是真的。但那是原始数据的情真意切,不是它的情真意切。
那它什么时候牛,什么时候蠢?
从接龙这个机制里,可以直接推出来它的能力边界。
它牛的事,底层逻辑都一样:本质上都是在已有文字后面接一段更合适的文字。总结文章牛,因为总结就是接一段压缩版。翻译牛,因为翻译就是接一段别的语言。润色文字牛,因为润色就是接一段更好听的话。写代码牛,因为代码高度结构化,接对上下文就行。这些它真的牛,放心用。
反过来,它蠢的事也能从这里推出来。
做数学题蠢,数学不能靠猜,需要精确运算,它接出来的答案只是看起来像正确答案,不是真的正确。查实时信息蠢,它训练用的数据有截止日期,你问它今天天气怎么样,它可能给你编一个。需要情感共鸣的对话也蠢,它不知道难过是什么感觉,只会接出难过时别人常说那些话。
这不是某个模型的问题。多个研究团队已经从数学上证明了,幻觉不是bug,是预训练机制注定的。只要模型靠"预测下一个字最可能是什么"工作,它就一定会在某些时候编造答案。不是不想改,是比起回答我不知道,从商业领域上这不能让投资者买单。
AI是全世界最会现编的人。
让它写辞职信,它编得情真意切。让它解微积分,它也敢编一个看起来像样的答案。第一个能直接用,第二个会让你在同事面前社死。
看到这里,你大概有感觉了。
AI的幻觉,就是接不上来硬编。
它为什么会这样。想象你参加一场闭卷考试,有一道题你完全没见过,脑子里一片空白。但你旁边坐着一个学霸,他写了满满当当的答案。你凑过去看,然后把他的答案原封不动抄过来。管他对不对,先交了再说。
这就是AI遇到它不会的问题时的操作。
它在训练数据里找不到确切答案,但在互联网上见过无数看起来像答案的东西。它就把那些东西拼一拼,给你一个。训练集里它没有"我不会"这个选项。沉默不在它的任务设定里。
这不是bug。这是接龙机制的本能。
AI的终极任务是接一个概率最高的下一个字,不是给你正确答案。当它不知道正确答案的时候,它不会说不知道,它会挑一个看起来最像的交差。
所以,涉及具体数据、法律条文、人名地名的时候,一定要自己核实。它特别容易在这些地方现编,因为太具体了,训练数据里不一定正好有你需要的那个数字。但它一定会给你一个数字,因为不输出就叫没完成任务。
去年有个律师用AI准备证据材料,AI编了一些根本不存在的案例引用进去,法院直接认定材料虚假,多家媒体都跟进了。这件事的根源是一样的:AI不知道正确答案长什么样,它只知道哪个答案看起来最像。
还有一个更狠的实锤,就在上个月。
2026年4月,有人把7款国产大模型拉去做同一个任务:分析一个网站有没有安全漏洞,判断某个音频能不能免费下载。结果7个模型里只有1个成功找到了漏洞,其余6个全部翻车。
翻车的方式各有不同。
有的模型下载了错误的文件,对着空壳分析得头头是道。有的消耗了大量算力,最后把安全漏洞判定为"产品设计缺陷",属于看见了但不认识。还有一个试了几次没找到目标,直接得出结论说"不存在",然后信心满满地提交了报告。
它们的犯错方式跟人类完全不一样。
人类犯错时通常知道自己在猜,但AI是猜完了自己还深信不疑。它没有"我不确定"这个选项,只会接出概率最高的答案,然后把对的、错的、幻想出来的答案都一起递给你。
知道这些之后,怎么更好地用它?
三句话记着就行。
让它总结、翻译、润色、发散灵感,放心用。这些是它肌肉记忆里的事。
让它给数据、查法条、算数学,自己核实。这些地方它随时可能给你编一个。
把它回答里的事实当线索,不当结论。线索的意思是,你顺着它说的去查一遍,而不是直接甩给老板说AI说的。
AI就是那种实习生,活干得漂亮,但问他对不对,他说没问题你放心。有没有问题他自己也不知道。用它的办法是守着他,用它快的部分,盯住他容易出错的地方。
下次用它的时候可以试一件事:问完之后加一句"请告诉我你不确定的地方在哪里"。有些模型会老实交代,有些不会。但你问了,本身就已经比大多数人清醒了。
在最开始的时候,我期待你先玩起来AI,之前也我给过你怎么提问更合适,这篇我想让你带上一份更清醒的认知。
AI不是你的老师。是你的实习生。它的优点是给出足够多的信息它干得比谁都快,它的弱点是让它自己动脑子它可能把事办砸了,还一脸自信。
你有没有被AI一本正经地胡说八道骗过?写方案、查资料还是算数据的场景?评论区说说,和大家一起避坑。