AI演进之路与教育应用指南
从机器人到GOFAI再到机器学习的阅读笔记
一本人工智能入门书籍的知识梳理
《给教师的人工智能教育》是一本2024年出版的国外著作,
与文学领域关联较少,更多聚焦于教育场景的应用,
其中第6章是全书的核心部分
作者:UCL教授 罗斯·卢金
译者:柴少明
以教学实践为核心,通过学生日志、
课堂互动等形式展开叙述;
在具体案例中阐述技术方法,部分概念跨度较大,
若强行整合叙述容易引发混淆,阅读过程较为轻松,
通读后能对人工智能发展脉络、数据处理技术、
以及机器学习形成初步认知。
谈人工智能离不开:学习、收集数据、迭代优化、技术应用这四个环节。
《牛津英语词典》对AI的定义:
计算机展现模拟人类智能行为的能力
一个里程碑式的事件:
1950年图灵提出“机器能思考吗?”并给出一个假设:如果计算机能够欺骗人类,让其相信它确实是人类,那么这台机器就可以被称为是智能的。
人工智能与人类智能的比较
GOFAI与机器学习
人工智能的两条演进路线:
机器人和人工智能密切相关,追溯其源头可以到“自动机”概念。机器人的核心是控制论(一个科学研究领域,控制论由维纳创立,主要研究动物和机器之间的控制与通信问题)。
01.GOFAI:传统机器人工智能
(Good Old Fashioned AI 简称GOFAI)这是一种基于规则和逻辑的人工智能系统,采用IF/THEN的条件语句形式。GOFAI的优势在于依赖专家知识和人工编码,规则高度透明,所有决策点都可以被解释清楚。
GOFAI也常被称为“符号主义人工智能”(Symbolic AI),计算机智能交互的软件也属于GOFAI范畴,如ELIZA系统(1964年设计,是一个扮演心理咨询师的程序,依靠预设的模板答案库),该系统的意义在于开创了一种特定的模拟智能行为的方法,并催生了众多“专家系统”。
GOFAI的巅峰是1997年的Deep Blue“深蓝”(由IBM研发,在国际象棋比赛中战胜了卡斯帕罗夫)其执行操作依赖预先编程。
除了基于规则的专家系统外,还有另一类人工智能研究试图模拟人类自身的认知过程,ACT是一种认知架构理论Adaptive Control of Thought自适应思维控制,由安德森研发,强调对人类记忆、学习与推理机制的模拟,后来被广泛应用于教育辅导软件与STEM学习系统。
02.机器学习
(Machine Learning)具有更强的泛化能力,能从海量数据中自动提取知识。代表性技术包括:神经网络/深度学习/图像识别/ChatGPT等大语言模型2011年谷歌创立谷歌大脑,Google Brain是深度学习时代的重要里程碑,后来的许多突破都与之相关(如TensorFlow、神经机器翻译、AlphaGo相关研究生态)。
与GOFAI依赖人工预设规则不同,
机器学习的规则并非专家手工编写,而是模型通过数据训练自动学习参数和模式,基于黑盒系统(Black Box System)无法让人全面了解决策的合理性。
因此出现了旨在为系统决策生成解释和理由的技术——可解释人工智能XAI(Explainable AI)。
人工智能的分类
当前的AI系统大多是:
GOFAI+机器学习的混合架构
无监督机器学习
人工智能的训练范式
人工智能采用多种不同类型的机器学习方法,无监督机器学习是其中之一(Unsupervised Machine Learning)数据没有“标准答案”(无标签),模型需要自己从数据中“发现结构”会探索数据中的相似性,寻找规律。
无监督机器学习的两种核心技术:
主成分分析(Principal Component Analysis,PCA)主要用于识别数据模式间差异的主要成分,并生成特征,将高维数据压缩成少量关键维度,解释数据模式间的比例变化。(主要用于降维)
聚类分析:自动将相似数据归类。(主要用于分组)
人工智能的分类
无监督机器学习的目标是:在准备好的数据中发现规律,通过特征识别(Feature Identification)和特征降维(Feature Reduction)过程后,确定一小部分特征来解释数据中的大部分变异。
有监督学习机器:是一种利用带标签的数据,通过学习输入与输出之间的映射关系,实现分类或预测任务的机器学习方法。适用于有明确目标的查找,并使用该技术实现分类。比如在分类问题中判断邮件是否为垃圾邮件,图像识别,医学诊断辅助等场景
特征工程
与多模态数据
与数据相关的行为包括:收集、存储、访问、负责任。特征工程是机器学习数据处理与建模准备阶段的统称。
数据类型主要包括:历史数据,定性的、定量的,技术交互过程中的行为数据以及多模态数据(一种综合人类各种感官的数据源,如眼动追踪、音频录制、手势识别、鼠标移动日志等)此外,模态作为信息的载体,是非常有价值的数据点,具有动态性和时间相关性。
就教育领域而言,收集多模态数据最有效的方法是通过支持视频的平台,例如虹膜连接技术
(Iris Connect Technology),通过监控系统、面部和语音识别系统收集(检测神经功能的特殊电极帽是一种侵入式的数据收集手段)、同行评审、调查问卷、第三方发布的公告、行为日志。注:不存在真正的原始数据,所有的数据收集都是有目的的。
特征工程是机器学习中的数据处理环节,
PCA则是常见的降维算法之一,
两者都用于降低数据复杂度并提取关键特征
回顾
机器学习整体流程
1.数据层
原始数据(行为、文本、图像等)
2.特征工程(Feature Engineering)
对数据进行处理,让模型更容易学习,例如:
数据清洗
标准化
编码(one-hot等)
特征选择
特征构造
降维(PCA只是特征工程中的“降维手段之一)
3.学习阶段(核心分支)
有监督学习(带标签)
无监督学习(无标签)
强化学习(奖励机制)
其他资源
目录
神经网络是深度学习系统采用的一种机器学习形式。
可以在这里了解更多关于神经网络的信息
目录
引言:理解人工智能的关键要素/1
第一章 什么是人工智能,它为何可能对教育有用?/1
AI是什么?/3
人工智能简史/4
可以学习的机器/10
透明度和AI,或理解黑匣子里正在发生的事情/14
自主性和自适应性/17
第二章 教育的挑战与人工智能/23
你面临的挑战是什么?/25
了解你的假设/31
谁拥有权力:人工智能还是人类智能?/32
将伦理纳入评估/34了解你的数据/36
为第三章做好准备/37
第三章 数据,无处不在的数据/41
为什么如此多地谈论数据?/44
数据到底是什么?/44
教育中的数据/45
回到机器学习人工智能/45
连接挑战与数据