通用人工智能听书解读
刘嘉老师从环境与策略两条维度出发,把人工智能划分为四种象限:
封闭环境 + 静态策略:依靠预先设定的规则与既有数据完成限定任务,扩展能力相对有限
开放环境 + 静态策略:属于传统符号主义AI的范畴,难以应对现实世界的复杂性与持续变化
封闭环境 + 动态策略:例如AlphaGo、完全自动驾驶(FSD)等系统,规则清晰但状态会随过程不断演化
开放环境 + 动态策略:通用人工智能(AGI),能够在多变环境中持续调整策略,面对不可预料的情境
AGI的关键在于:面对变化频繁、难以预测的现实场景,形成动态、可自适应的策略体系。
路径
核心思想
技术方向
典型代表
模拟人类行为
通过试错与奖惩机制反复校准行为策略
强化学习
学习骑自行车的过程
模拟大脑神经机制
借鉴大脑处理信息的方式,进一步提升学习能力
神经网络、计算神经科学、深度学习
人工神经网络
模拟人类认知能力
把握语言中承载的知识、思想与认知结构
自然语言处理、大规模预训练
ChatGPT、大模型
大模型的出现,是第三条路径迈向突破的重要节点,也意味着AI在开放环境中逐步呈现出接近通用智能的能力。
刘嘉提出,通识教育需要重点训练的五项核心能力,能够串联起完整的成长路径:
研究能力——能抓住本质问题并提出关键追问。"好的问题比正确的答案更重要"
统计能力——在信息堆叠与过载中辨别真实关联,从纷繁数据里抽取变量、理清结构
逻辑能力——从第一性原理出发进行推理,层层推演出新的认知框架
心理能力——理解自己、也理解他人,从而获得内在自由,避免被外界评价牵着走
修辞能力——能说服他人、推动共同行动,形成有效的协作与凝聚
能力提升路径:通过研究、统计与逻辑发现真理 → 借助心理能力获得内在自由 → 用修辞能力面向社会、凝聚伙伴、促成改变。
补充能力:借助大模型来提升学习效率。在大模型的赋能下,学习速度会明显快于传统正规课堂训练。
核心工作:手工搭建特征提取器,明确告知模型"该看什么"
行业金句:"Features matter more than algorithms"(特征比算法更关键)
走向消亡的原因:神经网络表明,它能够自动学到优于人工设计的特征
标志性事件:2012年AlexNet以15.3%的错误率(相较第二名低10个百分点)压过传统方法
核心工作:调整网络结构、优化超参数(俗称"炼丹")
自动化尝试:神经架构搜索(NAS)、AutoML
终结者:大模型的到来
转折点:2020年OpenAI发布GPT-3
核心工作:提示词工程(Prompt Engineering)→ 上下文工程(Context Engineering)
提示词工程为何逐渐失去优势:
大模型能力持续增强,语言理解也更强了
上下文窗口变大(从1k扩展到128k token),不再需要过度精心的措辞
新的挑战:上下文腐化(Context Rot)——当模型只使用到约10%的上下文时,就会出现"健忘"
上下文工程的三步走:召回(RAG检索增强生成)→ 压缩(摘要、拆分)→ 组织(信息的摆放位置与顺序)
产生原因:大模型本身更像是"被动的""静态的""受限的"系统——它难以真正执行行动,且存在知识截止
Agent的核心能力:
通过调用外部工具与API,让知识真正落到现实任务上(Grounding)
多轮推理-行动循环:推理→做出决定→调用工具→观察结果→更新理解→继续推理
核心工作:搭建Agent的决策骨架(规划系统、工具使用、记忆结构)
随之出现的新问题:搜索API超时如何处理?怎样追踪任务进度?如何避免旧错误再次发生?
术语提出:2026年2月,Mitchell Hashimoto(HashiCorp联合创始人)正式提出"Harness Engineering"
Harness的含义:原意是"马具",用来比喻把AI的能力引导到正确方向的约束与控制体系
核心创新:一套清晰、稳定且可持续演进的"规则手册"——包含目标定义、硬约束、角色设定与能力边界,并以代码仓库形式存储、版本化管理、便于追踪
核心工作:明确输入输出规范,设计工具调用的触发条件,构建反馈回路,并通过编排层确保多步骤协同执行
模式一:创新与瓶颈的循环
每一次升级都可能淘汰某类工作,但同时也会带来新的瓶颈
类比:汽车替代马车后,维修、设计、道路基础设施、交通管理、加油站等新职业随之出现
模式二:人类任务的向上迁移
从更细粒度的决策 → 走向宏观框架设计
从底层具体细节 → 转向高层战略引导
时代
人的角色(类比公司领导)
特征工程
亲自下场,替员工分担难题
超参数调优
提升员工本身的能力水平
提示/上下文工程
为员工补足更多关键信息
Agent工程
搭建更好的工作环境
Harness工程
解决融入系统的问题,把握整体方向
核心结论:纯粹的执行型技能正在被贬值,而决策能力与系统思维正在更受重视。
具体要求:
不要只盯着最新的框架、编码手法、模型架构——这些知识的半衰期正在变得越来越短
需要用更高抽象层级来处理工作:从写代码的工程师 → 发展为设计系统的架构师 → 进一步理解组织方向的战略师
"往下钻"(技术领域做到极致)的同时,更要坚持"往上走"(提升抽象层面)
培养方法:
多接触"全栈"项目:亲身体验从数据获取、模型训练、系统集成到风险控制的完整流程
从"怎么做"转向"为什么这样做"与"应该做什么":重点训练问题定义能力,而不仅是问题求解能力
理解知识背后的哲学与原理:知识会更新,但其中一些设计哲学的底层原理相对稳定
人类最厚的护城河:AI模型的优化目标由人来设定——什么是好、什么是坏,哪些指标更重要、哪些指标不重要。这些都包含人的判断、审美与更深层价值观,AI无法凭空自我生成。
研究能力的本质,并不在于是否会做实验、写论文,而在于能否识别本质问题并提出关键问题——好的问题比正确答案更关键。
在AI时代,人类真正难以替代的价值,不是更快地解决那些已被明确定义的问题,而在于定义正确的问题:识别潜藏的前提假设,找出问题空间里的关键落点,这才是人类核心竞争力。
AI模型的训练目标同样不是由AI自己决定,而是由人来界定——什么算好、什么算坏,哪些指标值得优化、哪些无需强调。这一切都包含人的判断、审美与深层价值观,是AI无法自动生成的。