AI微课堂第十期 | 操作系统级AI助手Marvis如何重塑高校教学管理
AI微课堂第十期
当人工智能融入操作系统,教师的行政与教学工作将迎来怎样的变革?
5月20日,腾讯推出了Marvis(马维斯),定位为"操作系统层级AI助手"。许多高校师生看到消息后的第一反应是:"又一款AI工具?跟ChatGPT、Claude、WPS灵犀Claw有什么不同?"
差异可不是一星半点。本文不讨论笼统的"文件管理""网页搜索"等通用功能,而是专门从高校教师的行政与教学场景切入,深入剖析Marvis真正"其他产品做不到"的那些新能力——以及它在这些场景中仍然"力所不能及"的地方。
一、为何Marvis的"操作系统级"定位对教师意义非凡?
先回答一个根本问题:教师为何要关注AI助手是"对话级"还是"操作系统级"?
因为我们日常工作中大量时间耗费在跨应用的重复操作上。举例说明——期末整理学生成绩:你需要从教务系统导出Excel,用公式算总评,打开QQ群发成绩通知,再打开学习通查看学生出勤记录,最后撰写一份期末教学总结Word文档。这5个步骤,涉及5个不同的软件,至少切换窗口十几次。
ChatGPT能帮你撰写教学总结的文案,但它无法直接调取你的Excel文件。WPS灵犀Claw可助你高效处理文档,却无法进入你的教务系统;Copilot能帮你操作Office系列软件,却管不了你的QQ与学习通。
Marvis的核心突破在于:它不依附于任何一个软件,而是直接部署在操作系统底层,通过GUI Agent(图形界面智能体)技术"观察"你电脑屏幕上的所有软件界面,像人一样点击、输入、操作。
这意味着:只要这个软件安装在你的电脑上,Marvis理论上就能操控它——无论它是教务系统、学习通、QQ、Excel还是任何一款没有API接口的老旧校园软件。
理解了这个底层逻辑,下面我们来看看它在教师工作中的六大具体新能力。
二、六大颠覆性新能力:逐一解析
新能力一:一句话搞定跨软件的行政流程自动化
这是Marvis对教师行政工作最大的颠覆。
以往,教师每学期都要重复一套固定流程:登录教务系统,进入排课管理-统计报表-教师课表输出模块查询并导出课表至Excel→按模板填写教学计划→登录教务系统进入授课计划申请页面上传计划表并提交审核→在QQ群里通知学生。这些操作涉及教务系统、Excel、QQ多个不同的软件或平台,每一步都要手动操作。
Marvis的多Agent架构可以自动串联这条跨软件链路。你说一句话,主控Agent就会把任务拆解,然后同时调度浏览器Agent去操作教务系统和OA、应用Agent去操作Excel和QQ,多个Agent并行推进,自动完成整套流程。
教师实操指令示例:
"帮我从教务系统导出这学期的课表,按照学院的教学计划模板填写好,保存为Word文档,然后上传到学院OA系统的教学计划提交模块,最后在2023级人工智能1班QQ群里发一条通知:'本学期教学计划已提交,请同学们查看。'"
关键点在于:这条链路跨越了4个不同的软件,而Marvis不需要其中任何一个软件提供API接口——它通过图形界面直接操作,就像一个"数字助教"替你坐在电脑前完成这一切。
其他AI助手为何做不到?因为ChatGPT和Claude是云端对话工具,无法触达你本机的软件;WPS灵犀Claw和OpenClaw虽然能操控桌面,但它们是单线程执行,无法像Marvis一样多Agent并行串联跨应用流程。
新能力二:教务系统自动巡查——告别手动刷新通知
许多高校教师都有过这样的经历:教务处突然发布调课通知或考试安排变更,可你恰好没注意到,直到学生前来询问才知晓。或者科研处的课题申报截止日期悄悄更新了,你错过了一天。
Marvis的定时监控能力可以直接解决这个难题。你可以设置一项持续运行的任务:
教师实操指令示例:
"每天早上8点自动访问学校教务处官网的通知公告页面,如果有新的通知,把标题和链接发到我的手机上。"
"帮我监控科研处的课题申报页面,如果有新的申报通知,立刻提醒我。"
"关注学校OA系统中我所在学院的所有待办事项,有新的审批任务就弹窗提醒。"
这个功能的核心价值在于:它是主动的,不是被动的。你不需要每天主动去刷网页,Marvis替你"值守"。其他AI助手要么网页相关功能存在局限(ChatGPT完全无法处理网页链接,Claude虽可访问网页链接并尝试总结内容,但存在生成虚假内容的风险),要么需要复杂的多步骤配置才能实现网页监控功能(OpenClaw需要满足macOS 11及以上系统、Node.js ≥ v22.0.0等环境要求,还要完成安装nvm、安装对应Node版本、运行官方安装脚本等一系列操作),而Marvis用一句话就能设定。
更值得注意的是,这种监控是跨端的——你在上课时手机静音,但Marvis可以通过电脑端监控网页,发现更新后推送到你的手机通知栏。这种"电脑替你盯着、手机替你收信"的跨端联动,是目前其他AI助手都做不到的。
新能力三:学生信息批量采集——请假审批到出勤统计一体化
教师处理学生日常事务时,大量时间花在"信息采集"上:翻看QQ群聊天记录找请假消息、去学习通查学生签到数据、从教务系统导出名单核对出勤率……这些信息分散在多个平台,手动汇总非常耗时。
Marvis的浏览器Agent可以同时登录多个平台,批量采集并自动汇总:
教师实操指令示例:
"帮我打开学习通,查看'人工智能导论'这门课最近两周的学生签到记录,再从QQ群聊天记录中找出这两周的请假消息,把两部分数据汇总成一份Excel表格,列出每个学生的出勤状态。"
请注意这个任务的复杂性:它同时涉及学习通(网页)和QQ(桌面应用)两个完全不同的平台。Marvis的浏览器Agent负责操作学习通网页,应用Agent负责操作QQ桌面客户端,主控Agent负责将两边采集的数据合并成一份表格。
这个"跨平台数据采集+自动汇总"的能力,是目前所有AI助手中Marvis独有的。ChatGPT只能帮你写汇总的代码,但无法直接访问你的学习通和QQ;Claw虽然能操控浏览器,但无法同时操控桌面应用和网页进行并行数据采集。
新能力四:课件资源智能整理——不只是"移动文件"
一学期下来,教师的电脑桌面上往往堆满了各种文件:不同课程的PPT、学生发来的作业截图、从知网下载的参考文献PDF、会议纪要Word、教学视频素材……学期末整理这些文件通常要花大半天。
但Marvis的文件Agent做的不是简单的"按扩展名分类"——它能理解文件内容,进行语义级别的智能归档:
教师实操指令示例:
"帮我把桌面和下载文件夹里所有本学期的教学相关文件整理一下。PPT课件按课程名分别放到E盘各课程文件夹里;学生作业统一放到E盘/2026春季/学生作业/文件夹,按学号命名;参考文献PDF放到E盘/2026春季/参考资料/文件夹。"
这里的关键词是"理解内容"。Marvis不只是看文件扩展名,它会识别文件名和内容中的课程关键词、学号格式、PDF是否为学术论文等,做出更智能的归类判断。
与之对比,WPS灵犀Claw也能做文件整理,但需要你编写更具体的指令或脚本来定义规则;而Marvis的优势在于用自然语言描述意图就够了,AI自动理解并执行。
新能力五:课堂投屏与设备联动——上课场景的跨端遥控
这是一个非常"教师专属"的场景。
大学教室通常配有大屏投影仪或智慧黑板,教师上课时需要在电脑上打开课件、播放视频、切换页面——这些操作通常要站在讲台上用手操作电脑,或者用翻页笔。
Marvis的跨端能力可以实现手机遥控电脑上课:
教师实操指令示例:
在手机上对Marvis说:"打开我桌面上的'人工智能导论_第五章.pptx',全屏放映。"
"翻到下一页。"
"打开浏览器,访问这个网址(粘贴链接),投屏到投影仪上。"
详细操作指南:
核心前提——环境配置,在正式上课"遥控"之前,你需要完成以下准备工作,这是实现"隔空取物"的基础:
1. 设备登录:确保你的手机和办公室/教室电脑都登录了同一个Marvis账号。
2. 开启远程:在电脑端Marvis设置中,开启"允许手机远程控制"权限(为了安全,默认通常是关闭的)。
3. 设备绑定:首次使用时,手机App会扫描局域网内的设备,你需要点击"信任"来绑定讲台电脑。
场景实操:一堂课的完整遥控流程
假设你正在讲授《人工智能导论》,手机在口袋里,人站在教室中间,电脑在讲台上。
第一步:开机与唤醒(站在讲台下)
你的动作:掏出手机,打开Marvis App,点击麦克风。
你的指令:"帮我打开讲台电脑上的'人工智能导论_第五章.pptx',全屏放映。"
后台执行:
Marvis通过网络连接到你办公室的电脑。
它利用文件Agent在电脑上搜索"人工智能导论"。
找到文件后,调用应用Agent启动PowerPoint,并发送"F5"全屏指令。
结果:投影仪上立刻显示出PPT的第一页。
第二步:流畅翻页(走在学生中间)
你的动作:为了强调某个知识点,你走到后排查看学生笔记,顺手掏出手机。
你的指令:"翻到下一页。"或者"回到上一页。"
后台执行:
Marvis识别这是PPT控制指令。
它向电脑发送键盘模拟信号(Right Arrow 或 Left Arrow)。
结果:投影画面随你心意切换,你无需为了翻页而"困守"在讲台区域。
第三步:动态插播网页(应对学生提问)
你的动作:有学生提问关于"Transformer模型"的最新论文,你想现场查一下。
你的指令:"打开浏览器,访问 arxiv.org,搜索关键词 Transformer。"
后台执行:
浏览器Agent接管任务,在电脑上打开Chrome/Edge。
自动输入网址并回车,等待页面加载后,模拟鼠标点击搜索框输入"Transformer"。
结果:讲台电脑屏幕上立刻显示出搜索结果,你可以直接用鼠标(或者继续用手机说"点击第一个链接")进行演示。
第四步:结束课程(准备下课)
你的指令:"退出全屏放映,关闭电脑。"(或者"锁定电脑")
结果:PPT退出,电脑黑屏或锁屏,下课走人,无需回讲台操作。
技术支撑:它是怎么做到的?
跨端联动:不同于微软Copilot手机版只能发提醒,Marvis利用端云协同技术,将手机作为"指挥终端",将电脑作为"执行终端"。
GUI操作:它不是简单的"远程桌面"让你在手机上戳小屏幕,而是通过自然语言转操作指令(NLU to GUI),直接在电脑上模拟鼠标点击和键盘输入。
注意事项
网络环境:教室电脑和你的手机需要连接在同一个校园网/WiFi下,或者电脑端保持联网状态。
隐私保护:在执行"打开PPT"指令前,Marvis会检测文件是否包含敏感信息,若开启隐私模式,它只会执行"打开"动作,不会将PPT内容上传云端。
新能力六:本地隐私模式——科研数据和学生信息不离开本机
这一点对于高校教师尤其重要。
我们处理的数据中,有大量敏感信息:学生成绩单、个人信息、科研项目未公开数据、课题申报书等。使用ChatGPT或Claude等云端AI时,所有数据都需要上传到服务器,这在很多高校的信息安全规范中是不被允许的。
Marvis支持本地隐私模式,核心系统操作(文件管理、应用操控、网页监控等)全部在本地完成,不需要将文件内容上传到云端。实测中,Marvis本地解析精度可达90%以上,日常文件整理、系统操作等任务完全可以在本地模式下完成。
对于处理学生成绩、科研数据等敏感信息的教师来说,"数据不出本机"不是锦上添花,而是刚需。这也是Marvis相比纯云端AI助手(ChatGPT、Claude、Kimi)在高校场景下的一个核心优势。
三、但必须坦诚地告诉你:Marvis目前做不到的事
深入分析完新能力,也必须说清楚Marvis在教师场景下的真实局限,避免过度期望:
第一,教学文档的深度制作仍然不是它的强项。Marvis能帮你创建文档草稿、整理素材,但制作一份排版精良的教学PPT、一份格式规范的课题申报书,它的输出质量和WPS灵犀Claw、专业AI PPT工具(Gamma、即触PPT等)相比有明显差距。实测中让它制作学术课件,等待时间长且排版粗糙。结论:文档制作请交给专业工具,Marvis负责流程串联。
第二,涉及身份验证的系统操作仍需人工介入。教务系统、OA平台等通常需要输入账号密码甚至验证码,Marvis会在这些节点暂停并请求用户手动操作。它不能"替你登录",只能在你已登录的状态下替你执行后续操作。
第三,数据提取准确率取决于信息源的规范程度。从QQ群聊天记录中提取请假信息时,如果学生发送的消息格式混乱(有人写"老师我发烧了",有人发语音,有人只写了"请假"两个字),提取的完整性会打折扣。实际测试准确率约70%-80%,可以作为辅助但不能完全替代人工核对。
第四,没有Python执行和数据分析能力。如果你需要对成绩单做统计分析、生成可视化图表、运行数据分析脚本,Marvis无能为力。这些场景仍然是WPS灵犀Claw(支持Python执行)或传统Excel的优势领域。
第五,产品刚上线十天,稳定性仍在打磨中。复杂的多Agent协作任务偶尔会出现步骤遗漏或任务中断,建议目前以简单明确的指令为主,待产品迭代成熟后再尝试更复杂的长链路任务。
四、教师场景工具选型:按需求匹配
最后,把Marvis放在教师实际工作流中,给出一个清晰的选型建议:
总结一句话:Marvis不是"什么都做得最好的",但它是"唯一能把教师跨软件行政流程自动化、跨端遥控上课、教务通知主动监控这三件事做到落地可用的"AI助手。这三件事,恰好是教师日常中最耗时、最枯燥、最没有技术含量、但又不得不做的部分——而Marvis替你把这些"杂活"扛了下来。
结语
若将AI助手的发展划分为三个阶段:第一阶段是"帮你写"(ChatGPT时代),第二阶段是"帮你做"(Claw/OpenClaw时代),第三阶段则是"帮你管"(Marvis时代)。从"帮你写一段文字",到"帮你操作一款软件",再到"帮你串联多类软件、跨越多台设备、自动完成整套工作流程"——这正是Marvis带来的本质性变革。它或许并非完美无缺,却清晰地指向了未来:教师的核心价值将从"流程处理"转向"教学设计",而那些机械重复的行政杂务,终将被操作系统级的AI助手所接管。