标签

AI的推理究竟是怎么回事?

发布时间:2026-06-04 18:31来源:微信阅读:4

这里是AI大白话第011篇。

上篇讲了,AI写东西就是猜概率,一个字一个字地猜。

那问题来了—— 一个只会"猜"的东西,为什么能推理、能思考、能帮你做决策?

更关键的是:它的"推理",真的靠谱吗?

先说清楚它到底怎么"推理"的,再聊值不值得信。

你可能会觉得,AI天生就会推理——它被造出来就这么聪明。

不是这么回事。AI能"推理",经历了三个阶段。

第一阶段:喂数据。让它"见世面"。

AI被塞进了几万亿字的文本——书、文章、论文、代码、对话、数学题、法庭辩论……

这个阶段,AI没"学会"什么,它只是"看过"。 但它看过的东西里,有大量的推理实例: "因为A,所以B" "如果X成立,那么Y也成立" "第一步……第二步……第三步……结论……"

几百万次,翻来覆去地看。

第二阶段:CLM预训练。让它学会"猜"。

这就是#010的核心:AI开始学"猜下一个字"。

从它看过的那些文本里,它慢慢摸清了——"当出现'因为',后面大概率接什么"、"当出现'第一步',隔几个词就会出现'第二步'"。

这个阶段结束后,AI学会了一件事:根据上文,猜下文。

但它还不会"回答问题"。你问它一句,它可能回你一堆不相干的。 因为它只是在猜词,不是在回答。

第三阶段:SFT监督微调。教它"回答问题要有推理的样子"。

这一步是关键。

训练者拿了大量的"问题-答案"对出来——比如几千条"问:为什么下雨后会有彩虹?答:因为……所以……"

让AI看这些例子,学一个模式:别人问问题的时候,应该先用一段推理,再给结论。

这个阶段结束后,AI终于学会了:

所以,你看到的"推理",其实就是这三步的成果。 看了太多推理文本(数据)→学会了预测推理的下文(CLM)→学会了用推理的方式回答问题(SFT)。

不是真在推,是看多了,记住了套路。

就像一个人看了1000部悬疑片,看到一半就能猜出凶手。 他不是推理能力强,是见过的套路太多了。

看到这你可能会说:所以AI就是在模仿?

对,一开始确实是这样。

SFT阶段,AI做的事情就是模仿——看"问题-答案"对,学"人家怎么回,我就怎么回"。

但模仿多了,会发生一件有意思的事:它开始"凭感觉"回答了。

你让AI算"一个苹果3块钱,买5个多少钱"。 它不是真在算"3×5=15",它是"感觉"到——"这种题我见过几千次了,答案应该是15"。

像你开车遇到红灯,你不会想"红灯代表停止,踩刹车",你看到红灯,脚就自己动了。 这就是直觉,不是推理,是身体记住了。

人的很多行为也都这么来的。 你学会了说话,不是因为背了语法规则,是听了太多"别人这么说",你的嘴记住了。 你学会了骑车,不是因为模拟了平衡公式,是摔了太多次,身体记住了。

AI也一样。 它看了太多"推理长什么样",它的计算器记住了推理的模式。 当你问它一个需要推理的问题,它不再是一步一步算,而是"感觉"到这里该接什么了。

看起来像在推理,其实就是数据喂出来的直觉。

但这不是说AI的推理完全不能用。它有一个很厉害的能力:泛化。

意思是,它没直接训练过的东西,它也能处理——只要跟它见过的"长得像"。

举个例子。 你教它学了一万道"鸡兔同笼"的数学题,但从来没教过"鸭猫同笼"。 AI看到"一个笼子里有鸭子和猫,一共10个头28只脚",它大概率也能做出来——因为它"感觉"到"这跟鸡兔同笼是一类题"。

不是真理解了,是"长得像,就按那个套路来"。

那问题就变成了:什么时候它的直觉靠谱,什么时候不靠谱?

我自己平时用下来,大致是这么分的——

信息类的,基本靠谱

整理资料、翻译、写初稿、解释概念,这些AI做得挺好。它的训练数据里这类东西最多,输出不要求精确,你复核一下就行。

推理类的,要留个心眼

比如写代码——常见模式很稳,但边界情况容易漏。让它写一个排序函数基本没问题,但极端输入可能没处理。 数据分析会说得很专业,但数字有可能是编的。 数学计算,简单题很稳,"1987×0.15"就不太靠谱了——它不是真算,是在"感觉"。

执行决策类的,别让它独立做

涉及钱、时间、实时信息的,比如"今天北京到上海最便宜的航班"——AI的知识有截止日期,它不知道最新情况。 让它帮你下单买东西,它可能自信满满地说"搞定了",实际规格都选错了。 个人决策更别让它做——"我应该换工作吗"这种问题,它给的都是普遍建议,不是你自己的情况。

所以我自己用AI的推理,就三条原则:

① 信息型的,直接让它做——够了,你过一眼就行。

② 推理型的,当第一稿用——让它写,但你要检查。当实习生,不是当专家。

③ 决策型的,让它出主意,你做决定——涉及钱和时间的,最终拍板的必须是你。

用AI的推理,就像用你手下最勤奋的实习生。能省很多时间,但你得自己把关。

觉得有用的话,下次让AI帮你做决策之前翻出来看看。

你让AI帮你做过什么决策?结果是靠谱还是翻车了?评论区聊聊 👇