AI的推理究竟是怎么回事?
这里是AI大白话第011篇。
上篇讲了,AI写东西就是猜概率,一个字一个字地猜。
那问题来了—— 一个只会"猜"的东西,为什么能推理、能思考、能帮你做决策?
更关键的是:它的"推理",真的靠谱吗?
先说清楚它到底怎么"推理"的,再聊值不值得信。
你可能会觉得,AI天生就会推理——它被造出来就这么聪明。
不是这么回事。AI能"推理",经历了三个阶段。
第一阶段:喂数据。让它"见世面"。
AI被塞进了几万亿字的文本——书、文章、论文、代码、对话、数学题、法庭辩论……
这个阶段,AI没"学会"什么,它只是"看过"。 但它看过的东西里,有大量的推理实例: "因为A,所以B" "如果X成立,那么Y也成立" "第一步……第二步……第三步……结论……"
几百万次,翻来覆去地看。
第二阶段:CLM预训练。让它学会"猜"。
这就是#010的核心:AI开始学"猜下一个字"。
从它看过的那些文本里,它慢慢摸清了——"当出现'因为',后面大概率接什么"、"当出现'第一步',隔几个词就会出现'第二步'"。
这个阶段结束后,AI学会了一件事:根据上文,猜下文。
但它还不会"回答问题"。你问它一句,它可能回你一堆不相干的。 因为它只是在猜词,不是在回答。
第三阶段:SFT监督微调。教它"回答问题要有推理的样子"。
这一步是关键。
训练者拿了大量的"问题-答案"对出来——比如几千条"问:为什么下雨后会有彩虹?答:因为……所以……"
让AI看这些例子,学一个模式:别人问问题的时候,应该先用一段推理,再给结论。
这个阶段结束后,AI终于学会了:
所以,你看到的"推理",其实就是这三步的成果。 看了太多推理文本(数据)→学会了预测推理的下文(CLM)→学会了用推理的方式回答问题(SFT)。
不是真在推,是看多了,记住了套路。
就像一个人看了1000部悬疑片,看到一半就能猜出凶手。 他不是推理能力强,是见过的套路太多了。
看到这你可能会说:所以AI就是在模仿?
对,一开始确实是这样。
SFT阶段,AI做的事情就是模仿——看"问题-答案"对,学"人家怎么回,我就怎么回"。
但模仿多了,会发生一件有意思的事:它开始"凭感觉"回答了。
你让AI算"一个苹果3块钱,买5个多少钱"。 它不是真在算"3×5=15",它是"感觉"到——"这种题我见过几千次了,答案应该是15"。
像你开车遇到红灯,你不会想"红灯代表停止,踩刹车",你看到红灯,脚就自己动了。 这就是直觉,不是推理,是身体记住了。
人的很多行为也都这么来的。 你学会了说话,不是因为背了语法规则,是听了太多"别人这么说",你的嘴记住了。 你学会了骑车,不是因为模拟了平衡公式,是摔了太多次,身体记住了。
AI也一样。 它看了太多"推理长什么样",它的计算器记住了推理的模式。 当你问它一个需要推理的问题,它不再是一步一步算,而是"感觉"到这里该接什么了。
看起来像在推理,其实就是数据喂出来的直觉。
但这不是说AI的推理完全不能用。它有一个很厉害的能力:泛化。
意思是,它没直接训练过的东西,它也能处理——只要跟它见过的"长得像"。
举个例子。 你教它学了一万道"鸡兔同笼"的数学题,但从来没教过"鸭猫同笼"。 AI看到"一个笼子里有鸭子和猫,一共10个头28只脚",它大概率也能做出来——因为它"感觉"到"这跟鸡兔同笼是一类题"。
不是真理解了,是"长得像,就按那个套路来"。
那问题就变成了:什么时候它的直觉靠谱,什么时候不靠谱?
我自己平时用下来,大致是这么分的——
信息类的,基本靠谱
整理资料、翻译、写初稿、解释概念,这些AI做得挺好。它的训练数据里这类东西最多,输出不要求精确,你复核一下就行。
推理类的,要留个心眼
比如写代码——常见模式很稳,但边界情况容易漏。让它写一个排序函数基本没问题,但极端输入可能没处理。 数据分析会说得很专业,但数字有可能是编的。 数学计算,简单题很稳,"1987×0.15"就不太靠谱了——它不是真算,是在"感觉"。
执行决策类的,别让它独立做
涉及钱、时间、实时信息的,比如"今天北京到上海最便宜的航班"——AI的知识有截止日期,它不知道最新情况。 让它帮你下单买东西,它可能自信满满地说"搞定了",实际规格都选错了。 个人决策更别让它做——"我应该换工作吗"这种问题,它给的都是普遍建议,不是你自己的情况。
所以我自己用AI的推理,就三条原则:
① 信息型的,直接让它做——够了,你过一眼就行。
② 推理型的,当第一稿用——让它写,但你要检查。当实习生,不是当专家。
③ 决策型的,让它出主意,你做决定——涉及钱和时间的,最终拍板的必须是你。
用AI的推理,就像用你手下最勤奋的实习生。能省很多时间,但你得自己把关。
觉得有用的话,下次让AI帮你做决策之前翻出来看看。
你让AI帮你做过什么决策?结果是靠谱还是翻车了?评论区聊聊 👇