标签

做AI教育产品经理,真正的壁垒在哪里?

发布时间:2026-06-05 07:16来源:微信阅读:3

2025年,能用Cursor写PRD文档、调用DeepSeek接口、搭建RAG系统的产品经理,已经一抓一大把了。

不是说这些技能不重要,而是说:它们已经不具备稀缺性了。

一个没有教育行业经验的互联网PM,花三个月时间认真学习,就能达到"能用AI工具做教育产品"的程度。

技术门槛在持续降低,这是客观事实。

那么,在这个技术趋于同质化的时代,真正在AI教育领域建立壁垒的人,护城河到底是什么?

我的答案是:比AI更懂教育。

但这句话说出来,大部分人的反应是:我在教育行业干了1到3年,我当然懂教育啊。

其实未必。

"在教育行业工作过"和"真正理解学习是如何发生的",是完全不同的两件事。而后者,才是AI教育PM真正的核心护城河。

这一点需要先说清楚,因为它是理解这篇文章的基础。

目前市面上大多数产品处于AI赋能Level 2-3阶段,头部创业公司正在向Level 4迈进。最初,大家都直接用ChatGPT做教育应用,但很快发现症结:通用模型对教育场景的理解不够深入,经常给出不符合教学规律的回答,甚至出现幻觉问题。

这段话里有一个关键发现:通用模型"不符合教学规律"。

那么,什么是教学规律?这个问题,技术能力回答不了——只有真正理解学习科学的人才能回答。

DeepSeek开源之后,AI的能力门槛几乎被拉平了。任何一个PM都可以调用相同的基础模型。

那么,A公司和B公司的AI教育产品,最终差距来自哪里?

来自:谁的产品更符合人类学习的真实规律。

这不是技术问题,是学习科学理解力的问题。

"学习科学"这四个字,大多数教育PM都听说过。但真正能把它用在产品设计里的,极少。

让我们来做一道测试题。

题目:一个AI辅导产品,正在设计"复习提醒"功能。有两个方案:

你会选哪个?

大多数PM会选B,因为"个性化"听起来更高级。

但如果你真正理解学习科学,你会知道:方案B的核心理论依据是间隔重复(Spaced Repetition),它的精髓不只是"个性化间隔",而是主动提取练习(Retrieval Practice)——让用户在即将遗忘的时刻主动回忆,而不是被动看一遍。

这意味着复习的形式至关重要:如果推送的是"再看一遍知识点的总结",效果远不如"直接给一道需要用这个知识点解决的题"。

一句话的差距,背后是对"提取练习比重复呈现更有效"这个学习科学结论的理解深度。

多邻国之所以能做到1.3亿月活,核心不是它的技术,而是它是目前商业产品中把间隔重复、主动提取、即时反馈三个学习科学原理应用得最彻底的产品。间隔重复系统基于记忆曲线,在用户即将遗忘时精准推送复习,70%记忆保留率的设置相比90%,实际上每日复习次数更少、耗时更少,但最终记住的内容反而更多。这个反直觉的结论,只有真正懂学习科学的产品团队才会在产品里敢于实现它。

PM需要真正理解的学习科学核心理论,至少包括:

认知负荷理论(Cognitive Load Theory):工作记忆容量有限,学习内容的呈现方式直接影响学习效率。任何教学材料和教学策略都需要适应学习者的认知加工规律,认知负荷的相关原则可以为智慧学习环境中工具、资源等元素的设计提供有效指导。对PM的产品设计意义是:一个界面同时呈现的信息不能超过工作记忆容量,功能点堆砌的产品会让学生学得更慢,而不是更快。

近侧发展区(Zone of Proximal Development):学生在独立能力和辅助能力之间存在一个"可学习区间"——任务太简单没有成长,太难产生习得无助。AI产品推送的内容,必须精准落在这个区间内。

主动提取效应(Testing Effect):主动回忆比被动复习的记忆效果强2到5倍。这意味着AI辅导产品的核心设计不应该是"给学生更多内容看",而是"设计更多让学生主动提取记忆的机会"。

成长心态vs固定心态(Mindset Theory):学生对"我能不能学好"的信念,直接影响学习行为。AI系统的反馈语言,是在强化"你很聪明"(固定心态)还是"你这次努力了"(成长心态),会产生截然不同的长期学习效果。

这些理论,不是用来装饰PPT的,而是应该直接体现在每一个产品功能的设计逻辑里。

"了解教育行业"和"深度理解教育场景",差距在于细节的层级。

举一个例子来说明这个差距。

浅层理解:"老师需要学情分析工具,帮助他们了解班级学习情况。"

深层理解:"初中数学老师在期中考试后有一个高强度的3天窗口期,他需要在这3天内完成:阅卷→分析→调整后续教学计划→个别学生辅导计划。他目前的痛点不是'没有数据',而是'数据太多但没有时间分析,而且不知道看哪里'。他需要的不是更完整的报告,而是一个在他最忙的时候能在30秒内告诉他'这次考试暴露的最需要处理的3个问题'的工具。"

这两层理解,会导致完全不同的产品设计。

前者做的是功能完整的学情分析平台;后者做的是嵌入老师工作节奏、在关键时刻主动推送最有价值信息的决策工具。

这周我们拆解过的六个产品方向——学习机、作业批改、学情分析、对话学伴、内容生成——每一个方向上,真正有产品差异化的公司,都是因为有人比竞争对手更深地理解了那个具体场景里用户的真实行为和心理。

有道Hi Echo做到盈利,因为他们比竞争对手更深地理解了"备考雅思的成年人,在练口语时的心理障碍是什么"。

多邻国做到1.3亿月活,因为他们比竞争对手更深地理解了"每天坚持学语言的动机是如何建立和维持的"。

场景理解力,是技术能力可以被复制、但这个理解不能被复制的东西。

这是AI教育PM里最稀缺的能力,也是行业里被忽视得最彻底的能力。

一个让人不安的问题:你的产品,真的有效吗?

不是"用户满意度高",不是"DAU增长",而是:你的产品,真的让用户学得更好了吗?

这个问题,大多数AI教育产品回答不了。

不是因为没有数据,而是因为:

衡量学习效果,比衡量任何其他互联网产品的效果,都要难得多。

原因一:时间滞后性。用户今天在你的产品上学了语法,效果可能在三个月后的考试里才能体现。传统互联网产品的次日留存、7日留存等指标,在教育产品里的意义很有限。

原因二:归因困难。用户分数提高了,是因为你的产品,还是因为他同时在上辅导班?还是因为他最近睡眠改善了?教育效果的单一变量控制,在真实场景里几乎不可能做到。

原因三:代理指标的陷阱。"用户在产品上做了多少道题"看起来是学习效果的代理指标,但如果用户是在做难度最低的题来保持连胜记录,这个数字毫无意义。"用户在产品上的时长"同样如此。

没有解决这三个问题的效果验证体系,产品就是在黑暗中飞行——你不知道自己有没有在朝正确的方向走。

市场正从"泛题材"切换至产品商业化路径及可持续商业模式搭建的实质性验证上。这个判断说的正是这件事——投资人和市场开始问"你的产品真的有效吗",能回答这个问题的公司,将在下一轮竞争中胜出。

真正能设计效果验证体系的PM,需要回答三个问题:

问题一:你的核心学习效果指标是什么?

不是DAU,不是时长,而是真实反映"用户学习能力有没有提升"的指标。

可能是:用户在同类知识点的二次答题准确率(衡量理解是否真实发生);用户间隔2周后对某个知识点的记忆保留率(衡量记忆是否稳固);用户独立解决新题的成功率而非依赖AI提示的成功率(衡量能力迁移是否发生)。

问题二:如何设计控制变量的效果实验?

教育场景做A/B测试有特殊难度——你不能把同一个学生同时放进对照组和实验组。但可以用:同校不同班级的对照、同一个学生的不同学科对照、长周期的前后对比设计。

问题三:如何区分"伪留存"和"真效果"?

多邻国的连胜记录会产生伪留存——用户为了不断Streak而每天做最简单的练习。真正有价值的产品需要识别并干预这个行为,引导用户进入真实的学习状态。

这三个问题的设计能力,既需要统计学和实验设计的基础知识,也需要对教育场景的深度理解,还需要勇气——因为效果验证做得越严格,产品有可能被证明没有想象中的效果。

愿意做严格效果验证的产品团队,才是真正有自信的团队。

说完三个核心竞争力,给出一条可以从今天开始走的路。

起点(1个月):读3本书——《认知天性》(彼得·布朗)、《为什么学生不喜欢上学》(丹尼尔·威林厄姆)、《刻意练习》(安德斯·艾利克森)。这三本书覆盖了AI教育产品最核心的学习科学原理,不需要任何学术背景就能读懂。

进阶(3个月):找到一个你正在做的产品功能,用认知负荷理论或间隔重复理论重新审视它的设计逻辑。问自己:这个设计,有没有违背这个理论的核心原则?如果有,能怎么改?

持续:关注《Journal of Learning Sciences》的中文摘要翻译资源,或者订阅"学习科学"相关的知乎专栏。不需要读所有文章,每个月认真读1篇和你正在做的产品相关的研究,一年之后你的学习科学认知会远超同行。

方法一:影随式用户研究。

不是问卷调查,不是焦点小组,而是去坐在真实的学生或老师旁边,看他们在产品上实际做了什么、在哪里停顿、在哪里感到困惑。每个月做一次2小时的影随研究,3个月后你对这个场景的理解会发生质变。

方法二:去做教育行业的"实习生"。

找机会去学校或教培机构做1到2周的观察访谈。不是作为"产品调研",而是真正去参与——坐进课堂听课,在老师办公室观察他们的日常,在家长群里看消息流。这段经历带来的场景认知,是任何二手资料都无法替代的。

方法三:建立"痛点笔记本"。

每次和教育用户沟通,专门记录他们说的"但是……""每次都要……""烦死了……"这类表达。这些是真实痛点的语言信号。积累100条这样的痛点,你对教育场景的理解就已经超过了大多数没做过这个积累的PM。

起点:找一本实验设计入门书(推荐《统计学》赵卫东版,不需要全读,重点看实验设计和A/B测试章节),建立基础的实验设计思维。

实践:在你当前负责的产品里,找一个"感觉有效果"但从来没有被验证过的功能,设计一个最小化的效果验证实验。哪怕这个实验做得不完美,做了之后你的效果验证能力会跳升一个台阶。

长期:建立产品的"学习效果指标体系"。每季度梳理一次:我们正在追踪哪些效果指标?这些指标真的能反映学习效果,还是代理指标?有没有被我们忽略的更重要的指标?

读完这篇文章,建议做一个5分钟的自我评估:

维度一:AI技术理解(1-5分)你能清楚描述RAG、微调、Prompt工程的区别和适用场景吗?能判断哪种技术方案适合哪类教育问题吗?

维度二:学习科学知识(1-5分)你能用至少3个学习科学理论,解释你现在做的产品里某个功能的设计逻辑吗?

维度三:教育场景理解力(1-5分)你能描述你的核心用户(老师或学生)从早到晚一整天的行为节奏,以及他们在这个节奏里的情绪状态和认知状态吗?

维度四:效果验证能力(1-5分)你能说出你产品的核心学习效果指标是什么,以及你如何验证这个指标反映的是真实的学习效果而不是代理指标吗?

大多数AI教育PM的现状是:维度一打4分,维度二打2分,维度三打2-3分,维度四打1-2分。

而真正在这个行业里有护城河的人,四个维度都至少在3分以上,且维度二、三、四是他们真正投入时间去建立的。

回到文章开头的问题:AI教育PM的核心竞争力是什么?

不是懂AI——因为AI的能力已经平权化了。

不是懂教育行业——因为在行业里工作过不等于理解了学习的本质。

是"比AI更懂教育"——理解人类学习的真实规律,理解教育场景里每一类用户的真实心理和行为,以及有能力验证你的产品是否真的让人学得更好。

这三件事,是任何大模型现在还做不到的。

AI可以生成100道题,但它不知道第101道题应该在什么时候、以什么方式、在什么样的情绪状态下出现,才能让这个具体的学生真正理解和记住。

知道这件事的人,才是AI教育产品里真正不可替代的角色。

不是会用AI的PM,是比AI更懂教育的PM。

AI降低了技术门槛,但提高了对"真正理解教育"这件事的要求。

技术越强大,越需要真正懂教育的人来驾驭它。

这个时代,留给真正懂教育的产品经理的机会,比以往任何时候都大。

参考资料:

1.《认知天性》(彼得·布朗等,2018年);

2.《为什么学生不喜欢上学》(丹尼尔·威林厄姆,2010年);

3.多鲸资本《2025 AI赋能教育行业趋势报告》;

4.东方财富证券《AI教育专题报告(一)》(2025年2月);

5.智慧学习环境中的认知负荷问题研究(高媛等,北师大,2018年);

6.间隔重复记忆系统FSRS相关研究(知乎,2025年)。

[PM自测]在学习科学、教育场景理解、效果验证三个维度里,你认为自己现在最薄弱的是哪一个?你打算用什么方式在接下来3个月内提升它?