标签

通用人工智能听书解读

发布时间:2026-05-08 21:38来源:微信阅读:7

刘嘉老师从环境与策略两条维度出发,把人工智能划分为四种象限:

封闭环境 + 静态策略:依靠预先设定的规则与既有数据完成限定任务,扩展能力相对有限

开放环境 + 静态策略:属于传统符号主义AI的范畴,难以应对现实世界的复杂性与持续变化

封闭环境 + 动态策略:例如AlphaGo、完全自动驾驶(FSD)等系统,规则清晰但状态会随过程不断演化

开放环境 + 动态策略:通用人工智能(AGI),能够在多变环境中持续调整策略,面对不可预料的情境

AGI的关键在于:面对变化频繁、难以预测的现实场景,形成动态、可自适应的策略体系。

路径

核心思想

技术方向

典型代表

模拟人类行为

通过试错与奖惩机制反复校准行为策略

强化学习

学习骑自行车的过程

模拟大脑神经机制

借鉴大脑处理信息的方式,进一步提升学习能力

神经网络、计算神经科学、深度学习

人工神经网络

模拟人类认知能力

把握语言中承载的知识、思想与认知结构

自然语言处理、大规模预训练

ChatGPT、大模型

大模型的出现,是第三条路径迈向突破的重要节点,也意味着AI在开放环境中逐步呈现出接近通用智能的能力。

刘嘉提出,通识教育需要重点训练的五项核心能力,能够串联起完整的成长路径:

研究能力——能抓住本质问题并提出关键追问。"好的问题比正确的答案更重要"

统计能力——在信息堆叠与过载中辨别真实关联,从纷繁数据里抽取变量、理清结构

逻辑能力——从第一性原理出发进行推理,层层推演出新的认知框架

心理能力——理解自己、也理解他人,从而获得内在自由,避免被外界评价牵着走

修辞能力——能说服他人、推动共同行动,形成有效的协作与凝聚

能力提升路径:通过研究、统计与逻辑发现真理 → 借助心理能力获得内在自由 → 用修辞能力面向社会、凝聚伙伴、促成改变。

补充能力:借助大模型来提升学习效率。在大模型的赋能下,学习速度会明显快于传统正规课堂训练。

核心工作:手工搭建特征提取器,明确告知模型"该看什么"

行业金句:"Features matter more than algorithms"(特征比算法更关键)

走向消亡的原因:神经网络表明,它能够自动学到优于人工设计的特征

标志性事件:2012年AlexNet以15.3%的错误率(相较第二名低10个百分点)压过传统方法

核心工作:调整网络结构、优化超参数(俗称"炼丹")

自动化尝试:神经架构搜索(NAS)、AutoML

终结者:大模型的到来

转折点:2020年OpenAI发布GPT-3

核心工作:提示词工程(Prompt Engineering)→ 上下文工程(Context Engineering)

提示词工程为何逐渐失去优势:

大模型能力持续增强,语言理解也更强了

上下文窗口变大(从1k扩展到128k token),不再需要过度精心的措辞

新的挑战:上下文腐化(Context Rot)——当模型只使用到约10%的上下文时,就会出现"健忘"

上下文工程的三步走:召回(RAG检索增强生成)→ 压缩(摘要、拆分)→ 组织(信息的摆放位置与顺序)

产生原因:大模型本身更像是"被动的""静态的""受限的"系统——它难以真正执行行动,且存在知识截止

Agent的核心能力:

通过调用外部工具与API,让知识真正落到现实任务上(Grounding)

多轮推理-行动循环:推理→做出决定→调用工具→观察结果→更新理解→继续推理

核心工作:搭建Agent的决策骨架(规划系统、工具使用、记忆结构)

随之出现的新问题:搜索API超时如何处理?怎样追踪任务进度?如何避免旧错误再次发生?

术语提出:2026年2月,Mitchell Hashimoto(HashiCorp联合创始人)正式提出"Harness Engineering"

Harness的含义:原意是"马具",用来比喻把AI的能力引导到正确方向的约束与控制体系

核心创新:一套清晰、稳定且可持续演进的"规则手册"——包含目标定义、硬约束、角色设定与能力边界,并以代码仓库形式存储、版本化管理、便于追踪

核心工作:明确输入输出规范,设计工具调用的触发条件,构建反馈回路,并通过编排层确保多步骤协同执行

模式一:创新与瓶颈的循环

每一次升级都可能淘汰某类工作,但同时也会带来新的瓶颈

类比:汽车替代马车后,维修、设计、道路基础设施、交通管理、加油站等新职业随之出现

模式二:人类任务的向上迁移

从更细粒度的决策 → 走向宏观框架设计

从底层具体细节 → 转向高层战略引导

时代

人的角色(类比公司领导)

特征工程

亲自下场,替员工分担难题

超参数调优

提升员工本身的能力水平

提示/上下文工程

为员工补足更多关键信息

Agent工程

搭建更好的工作环境

Harness工程

解决融入系统的问题,把握整体方向

核心结论:纯粹的执行型技能正在被贬值,而决策能力与系统思维正在更受重视。

具体要求:

不要只盯着最新的框架、编码手法、模型架构——这些知识的半衰期正在变得越来越短

需要用更高抽象层级来处理工作:从写代码的工程师 → 发展为设计系统的架构师 → 进一步理解组织方向的战略师

"往下钻"(技术领域做到极致)的同时,更要坚持"往上走"(提升抽象层面)

培养方法:

多接触"全栈"项目:亲身体验从数据获取、模型训练、系统集成到风险控制的完整流程

从"怎么做"转向"为什么这样做"与"应该做什么":重点训练问题定义能力,而不仅是问题求解能力

理解知识背后的哲学与原理:知识会更新,但其中一些设计哲学的底层原理相对稳定

人类最厚的护城河:AI模型的优化目标由人来设定——什么是好、什么是坏,哪些指标更重要、哪些指标不重要。这些都包含人的判断、审美与更深层价值观,AI无法凭空自我生成。

研究能力的本质,并不在于是否会做实验、写论文,而在于能否识别本质问题并提出关键问题——好的问题比正确答案更关键。

在AI时代,人类真正难以替代的价值,不是更快地解决那些已被明确定义的问题,而在于定义正确的问题:识别潜藏的前提假设,找出问题空间里的关键落点,这才是人类核心竞争力。

AI模型的训练目标同样不是由AI自己决定,而是由人来界定——什么算好、什么算坏,哪些指标值得优化、哪些无需强调。这一切都包含人的判断、审美与深层价值观,是AI无法自动生成的。