AI究竟如何“运算”思考?读懂基础原理
2023年,ChatGPT突然走红,既能写文章、也能编代码,还能陪你聊天。2024年,Sora凭借文字指令生成视频。到了2025年,AI助手甚至能协助你订机票、做PPT,甚至参与疾病判断。
不少人会好奇:"AI为什么看起来这么聪明?它是不是已经有意识了?"
但结论很明确:没有。
今天的大多数AI,本质上仍是一个"超强概率计算器"。它不是真正"理解"现实,而是把注意力放在"预测下一个词/像素/动作"上,能力主要体现在预测得准不准。
弄懂这一点,就等于拿到了理解AI的关键。
我们可以先用一个类比:
假设有个孩子在学说话:
他听到大人说"我要吃苹果"
又听到"我要吃香蕉"
再听到"我要吃葡萄"
很快他就能推断:当听见"我要吃"时,下一个词大概率会落在某种水果上。
AI的学习流程和这个孩子的方式非常接近,只是规模被放大了无数倍。
以ChatGPT为例,它训练时"消化"了互联网上数千亿字的内容,包括书籍、网页、论文与对话文本。这里并不是口头比喻,而是把文字内容换成数字表示,交给计算机去处理。
素材越丰富、质量越高,AI提炼出的规律也就越可靠。
不过只给教材不够,还要有合适的学习方法。AI的"核心部件"叫做神经网络,它的灵感来源于人脑里神经元之间的连接方式。
最基础的神经网络通常分成三层:
输入层:负责接收信息(例如"今天天气"这类输入)
隐藏层:不断加工并抽取特征(区分与"天气"、"温度"、"下雨"相关的模式)
输出层:给出预测结果(判断下一个词更可能是"很好"、"不错"还是"糟糕")
像ChatGPT这样的大型模型,往往拥有上千亿个参数。可以把参数理解成类似大脑连接点的数值开关;参数越多,模型能学到的规律也越复杂。
训练AI有点像让学生不断刷题:
第一步:先让AI尝试猜测。比如给出半句话"人工智能是未来的",让它预测下一个词。它可能会猜"趋势""技术""希望"之类的候选。
第二步:把预测结果和标准答案对照。如果正确答案是"趋势",而它猜的是"技术",那就说明预测偏差了。
第三步:根据错误的程度去更新参数。也就是对那上千亿个参数做调整,让它下次更倾向于猜对。
这种循环会重复很多很多次,直到模型在绝大多数情况下都能更准确地预测下一段要出现的词。
因此,大语言模型真正的关键秘密不是"理解",而是"预测"。
2017年,谷歌发布了论文《Attention Is All You Need》,提出了Transformer架构,这成为现代AI的重要里程碑。
来看这样一句话:"小明把苹果给了小红,因为她饿了。"
"她"在指谁?答案不是小明,而是小红(因为饿的人是她)。
人类之所以能很快判断,是因为我们会把注意力集中在最关键的信息上。
Transformer也让AI具备类似能力:它会计算句子里每个词与其他词之间的相关程度,进而让重要词获得更高的权重。
比如在这句话中:
"她"和"小红"的相关性:95%
"她"和"小明"的相关性:10%
"她"和"苹果"的相关性:30%
当这些权重被计算出来,AI就能更准确地预测"她"指的是小红。
注意力机制也缓解了传统AI"难以处理长句"的问题,让ChatGPT能够理解并组织更长文本的上下文。
你可能注意到:ChatGPT不仅能回答问题,还能写诗、编故事,甚至生成代码。它是怎么做到的?
当你让ChatGPT写一首关于春天的诗:
你输入:"请写一首关于春天的诗"
AI会先预测第一个词:"春风"
再把"春风"接到输入后面,预测第二个词:"拂面"
继续把"春风拂面"加入到上下文,预测第三个词:"花"
如此循环往复,直到生成完整的诗句。
每一次预测都会参考它已经生成出来的全部内容,所以输出才能保持连贯。
另外,AI生成还会用到一个"温度"设置:
低温(如0.2):更倾向于选择概率最高的词,回答更稳妥、更准确
高温(如1.5):偶尔会选概率较低但更有意思的词,答案更有创意,但也更容易出错
也正因如此,同一个问题,ChatGPT有时能给出严谨回答,有时又会跳出意外的思路。
理解AI原理的同时,也要看清它的边界:
AI知道"火是热的",却没有"热"这种真实感受。它只是从训练数据里学到"火"与"热"经常一起出现。
由于AI的本质是"挑选最可能出现的词",如果训练材料里没有对应的正确答案,它可能会生成一个看上去合理的内容。比如捏造虚构的条文,或编出看似真实的历史事件。
AI可以发现"冰淇淋销量"与"溺水事故"之间存在很高的相关性,但并不会真正理解其中的因果链条。它可能误认为"吃冰淇淋导致溺水",而忽略背后的共同因素。
AI的知识会停留在训练结束的那一刻,之后发生的事情它并不知道(除非进行联网检索)。训练数据中的偏见也可能被AI学习并反映出来。
目前阶段的AI大多属于"窄AI"(Artificial Narrow Intelligence):在特定任务上表现超过人类,但并不具备通用智能。
下一阶段被称为"通用AI"(AGI),能像人类一样学习并适应各种新任务。更长远的设想是"超级AI"(ASI),在所有方向上都超过人类最聪明的个体。
不过即便到了那一天,AI的底层逻辑可能仍会类似:依旧是基于数据寻找规律,只是这些规律足够复杂,以至于看起来像"理解"了。
回到开头的问题:AI有意识吗?
从原理层面看,今天的AI可以视为一套复杂的数学运算,是在海量数据上训练得到的统计模型。它没有欲望、没有情绪,也没有自我意识。
但这并不会削弱它的价值。就像飞机不需要像鸟一样拍动翅膀才能飞行,AI也不必拥有人的思考方式,就能帮助人类完成工作。
理解AI的原理并不是为了把它神化或妖魔化,而是为了更好地使用它。
在这个AI迅速普及的时代,能熟练用AI的人与不会用AI的人之间的差距,可能会比过去想象得更大。