通用人工智能听书解读

发布时间：2026-05-08 21:38阅读：10

刘嘉老师从环境与策略两条维度出发，把人工智能划分为四种象限：

封闭环境 + 静态策略：依靠预先设定的规则与既有数据完成限定任务，扩展能力相对有限

开放环境 + 静态策略：属于传统符号主义AI的范畴，难以应对现实世界的复杂性与持续变化

封闭环境 + 动态策略：例如AlphaGo、完全自动驾驶（FSD）等系统，规则清晰但状态会随过程不断演化

开放环境 + 动态策略：通用人工智能（AGI），能够在多变环境中持续调整策略，面对不可预料的情境

AGI的关键在于：面对变化频繁、难以预测的现实场景，形成动态、可自适应的策略体系。

路径

核心思想

技术方向

典型代表

模拟人类行为

通过试错与奖惩机制反复校准行为策略

强化学习

学习骑自行车的过程

模拟大脑神经机制

借鉴大脑处理信息的方式，进一步提升学习能力

神经网络、计算神经科学、深度学习

人工神经网络

模拟人类认知能力

把握语言中承载的知识、思想与认知结构

自然语言处理、大规模预训练

ChatGPT、大模型

大模型的出现，是第三条路径迈向突破的重要节点，也意味着AI在开放环境中逐步呈现出接近通用智能的能力。

刘嘉提出，通识教育需要重点训练的五项核心能力，能够串联起完整的成长路径：

研究能力——能抓住本质问题并提出关键追问。"好的问题比正确的答案更重要"

统计能力——在信息堆叠与过载中辨别真实关联，从纷繁数据里抽取变量、理清结构

逻辑能力——从第一性原理出发进行推理，层层推演出新的认知框架

心理能力——理解自己、也理解他人，从而获得内在自由，避免被外界评价牵着走

修辞能力——能说服他人、推动共同行动，形成有效的协作与凝聚

能力提升路径：通过研究、统计与逻辑发现真理 → 借助心理能力获得内在自由 → 用修辞能力面向社会、凝聚伙伴、促成改变。

补充能力：借助大模型来提升学习效率。在大模型的赋能下，学习速度会明显快于传统正规课堂训练。

核心工作：手工搭建特征提取器，明确告知模型"该看什么"

行业金句："Features matter more than algorithms"（特征比算法更关键）

走向消亡的原因：神经网络表明，它能够自动学到优于人工设计的特征

标志性事件：2012年AlexNet以15.3%的错误率（相较第二名低10个百分点）压过传统方法

核心工作：调整网络结构、优化超参数（俗称"炼丹"）

自动化尝试：神经架构搜索（NAS）、AutoML

终结者：大模型的到来

转折点：2020年OpenAI发布GPT-3

核心工作：提示词工程（Prompt Engineering）→ 上下文工程（Context Engineering）

提示词工程为何逐渐失去优势：

大模型能力持续增强，语言理解也更强了

上下文窗口变大（从1k扩展到128k token），不再需要过度精心的措辞

新的挑战：上下文腐化（Context Rot）——当模型只使用到约10%的上下文时，就会出现"健忘"

上下文工程的三步走：召回（RAG检索增强生成）→ 压缩（摘要、拆分）→ 组织（信息的摆放位置与顺序）

产生原因：大模型本身更像是"被动的""静态的""受限的"系统——它难以真正执行行动，且存在知识截止

Agent的核心能力：

通过调用外部工具与API，让知识真正落到现实任务上（Grounding）

多轮推理-行动循环：推理→做出决定→调用工具→观察结果→更新理解→继续推理

核心工作：搭建Agent的决策骨架（规划系统、工具使用、记忆结构）

随之出现的新问题：搜索API超时如何处理？怎样追踪任务进度？如何避免旧错误再次发生？

术语提出：2026年2月，Mitchell Hashimoto（HashiCorp联合创始人）正式提出"Harness Engineering"

Harness的含义：原意是"马具"，用来比喻把AI的能力引导到正确方向的约束与控制体系

核心创新：一套清晰、稳定且可持续演进的"规则手册"——包含目标定义、硬约束、角色设定与能力边界，并以代码仓库形式存储、版本化管理、便于追踪

核心工作：明确输入输出规范，设计工具调用的触发条件，构建反馈回路，并通过编排层确保多步骤协同执行

模式一：创新与瓶颈的循环

每一次升级都可能淘汰某类工作，但同时也会带来新的瓶颈

类比：汽车替代马车后，维修、设计、道路基础设施、交通管理、加油站等新职业随之出现

模式二：人类任务的向上迁移

从更细粒度的决策 → 走向宏观框架设计

从底层具体细节 → 转向高层战略引导

时代

人的角色（类比公司领导）

特征工程

亲自下场，替员工分担难题

超参数调优

提升员工本身的能力水平

提示/上下文工程

为员工补足更多关键信息

Agent工程

搭建更好的工作环境

Harness工程

解决融入系统的问题，把握整体方向

核心结论：纯粹的执行型技能正在被贬值，而决策能力与系统思维正在更受重视。

具体要求：

不要只盯着最新的框架、编码手法、模型架构——这些知识的半衰期正在变得越来越短

需要用更高抽象层级来处理工作：从写代码的工程师 → 发展为设计系统的架构师 → 进一步理解组织方向的战略师

"往下钻"（技术领域做到极致）的同时，更要坚持"往上走"（提升抽象层面）

培养方法：

多接触"全栈"项目：亲身体验从数据获取、模型训练、系统集成到风险控制的完整流程

从"怎么做"转向"为什么这样做"与"应该做什么"：重点训练问题定义能力，而不仅是问题求解能力

理解知识背后的哲学与原理：知识会更新，但其中一些设计哲学的底层原理相对稳定

人类最厚的护城河：AI模型的优化目标由人来设定——什么是好、什么是坏，哪些指标更重要、哪些指标不重要。这些都包含人的判断、审美与更深层价值观，AI无法凭空自我生成。

研究能力的本质，并不在于是否会做实验、写论文，而在于能否识别本质问题并提出关键问题——好的问题比正确答案更关键。

在AI时代，人类真正难以替代的价值，不是更快地解决那些已被明确定义的问题，而在于定义正确的问题：识别潜藏的前提假设，找出问题空间里的关键落点，这才是人类核心竞争力。

AI模型的训练目标同样不是由AI自己决定，而是由人来界定——什么算好、什么算坏，哪些指标值得优化、哪些无需强调。这一切都包含人的判断、审美与深层价值观，是AI无法自动生成的。

← 上一篇：高中思政AI教案：5个实操案例直接可用下一篇：我国人工智能产业发展现状与未来展望 →