教育中的AI智能体:如何用 AI 干“正事” --知识铺
OpenAI(ChatGPT的公司)进行了一项实验,AI和人类专家PK完成任务。选的是人类专家要做4到7个小时的复杂任务,AI做一份,专家做一份,考官需在不知道来源的情况下,评判哪一份更好(横跨 9 大行业、44 种职业;完整集共 1,320 个任务)。
AI智能体是能完成特定任务的具体AI应用,而目前的AI智能体能力的下限是AI大模型的能力,大模型本身完成任务能力的提升会为智能体带来底层能力的飞跃。
OpenAI宣布的结果是,尽管人类专家最终获胜,但优势“微乎其微”。考虑到任务的复杂性,这已经是一个惊人的成就。这不仅仅是一次技术演示,而是“AI生产力”从理论向量产转化的一次关键测试。
但这是否意味着人工智能能完成人类的工作了?
远远没有,因为衡量的不是工作,而是任务。而我们的工作包含许多任务。
我们的工作绝非单一的任务,以教师工作为例,它涵盖了教学、维持课堂秩序、备课、课题申报、填写各项报告、指导学生、家校沟通、行政、心理疏导等多个层面,甚至还包括打扫办公室的卫生、查寝。
OpenAI这次测试的任务主要集中在可以在电脑上完成的、独立的知识工作,不包括体力劳动或需要大量隐性知识和人际沟通的任务。且任务都是是“一次性”的,一条指令提供了所有背景信息,而现实工作大多数都不是交代一下就可以开工了,往往需要通过反复沟通来明确需求。
人工智能完成一项或多项任务,但这并不能取代老师的全部工作。而这恰恰也为开发教育AI智能体指明了方向:完成特定任务,帮老师更好地工作。
关于AI教育智能体研究
大部分读者都熟悉,我解读过很多AI教育研究,自己也做AI教育研究;讲过AI教育也讲过AI智能体。但正儿八经讲「AI教育智能体」的,今天是第一次。这么有流量的话题我为什么不讲呢?因为…巧妇难为无米之炊…
最近有一个粉丝问我:
关于AI时代智能体对外语教学方式的变革研究(尤其是高等教育),国内外有什么具有代表性的研究。
我回答的是,很可惜,这次还没有代表性的研究。
不只是外语或高等教育,而是整个教育界。
我们想象中最好的教学智能体或许是“一对一因材施教的AI导师”,为每个孩子提供一个耐心无限的导师,真正实现个性化教育。当然,最好很难定义,最差定义起来比较简单。最差的教学智能体就是和ChatGPT、豆包同一水平,回答些问题、完成些任务。有更差的吗?当然有,可是如果在教育场景中表现还不如ChatGPT或豆包,这个智能体就失败了——优化完了还不如原生模型,这不是“好与坏的价值论问题”,而是“生存与毁灭的存在论问题”,这就是做就失败了。
基于AI大模型的教育智能体应该是AI在教育场景中的特化,如果想做真的“一对一因材施教的AI导师”,不是说优化一下提示词就完事了,而是维护一个长期的、动态的学生画像——知道学生昨天学了什么、哪里有困难、今天的学习情绪如何,等等等等。我们目前可以让AI无限接近优秀教师的语言风格、知识水平,可真正需要优化的是让AI记住每一个学生。
我们不讨论这个什么时候能做出来。继续讨论“To Be or Not To Be”。
很多研究证明了AI智能体可以提供“个性化练习”、“24/7口语陪练”等,但这些任务,一个设计精良的LLM应用(比如带语音功能的ChatGPT)似乎也能完成。
目前学者们和商业科技大佬普遍认为,智能体的真正价值在于其“代理性”(Agency,抱歉,这个词太难翻译了),即超越简单的“一问一答”,具备主动性、记忆力、规划能力。比如:
1.智能体能根据学习者的进度和状态,主动发起对话、推荐学习任务,而不是被动等待指令。
2.能为了一个长期的教学目标(如“帮助学生掌握商务谈判的语用策略”)而规划和执行一系列交互任务。
3.能调用外部工具(如词典、搜索引擎、学习资源库)来辅助教学。
一个纯粹的AI大模型本身不具备这些特性,而“智能体”正是封装了的AI,并赋予其记忆、规划、主动性和工具使用能力的框架。真正的AI教育智能体研究,就是要证明这种“代理性”带来了AI大模型本身无法实现的教学效果。
没错,AI智能体教育研究,不仅要对比它和传统教学法的差异,还要对比和使用ChatGPT、豆包这样的AI大模型之间的差异——如果你的效果还不如ChatGPT,那为啥要开发这个东西呢?
用AI做正事
我们不是AI开发者,也不算智能体设计师,不如多讨论,如何用AI做有价值的事。如果我们不认真思考我们为什么要工作,以及工作应该是什么样子,我们都将被淹没在AI生产力的狂欢中。
有一个笑话说,领导让我写学期报告,我想了半天只写了五句话,没办法让AI扩到了十页,领导一看,写这么多,对我说,“写得不错,你能不能用AI总结成五句话?”
沃顿商学院的莫里克教授讲了一件事,他给了AI一份公司备忘录,让他把它做成 PPT,然后加了一句,尽量多做点。然后AI做了17份PPT。
这正是典型的“无目的的生产力”。
OpenAI的论文提出了一种以人为中心的协作流程,当然,这些也都不新鲜:
-
将任务的“第一稿”交给AI完成。
-
人类专家负责审查和评估AI的成果。
-
如果需要,专家可以提供修正意见或更精确的指令。
-
如果AI仍然无法胜任,专家再亲自接手完成。
据OpenAI说:
这种工作流程能将任务完成速度提升40%,并将成本降低60%,同时确保人类始终掌握最终的控制权。
我以前有一次讲过一个案例(AI智能体的能力与不透明性是同步增长的),莫里克教授用AI发现自己已经发表的论文中依然存在的漏洞,在AI发现之前,他自己和审稿人都没有看到。
同样的技术,能够在几分钟内指出论文中被忽视的错误,也能生成 17 个没人想去看的PPT。这不在于人工智能本身,而在于我们如何选择使用它。
我们得决定什么值得做,而不仅仅是可以做什么。
经过超半年的尝试,我运营的「教育学人AIED知识社区」已经逐步和一些老师们形成了一个学习共同体。目前主要是我的日常分享和三个专栏——「AI时代的教育」、「标准和框架」、「教育学经典讲读」,「当代教学理念潮流」。专栏依托于不同类型的优质资源的分析和解读(由我和粉丝们共同选出),「日常分享」结合实事和大家的疑问进行更新(如:GPT-5使用心得、不同学者和机构对创新的定义等…)
接下来我会继续优化,在结构化和社群化方面继续提升,让大家不虚此行。
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/ai/post/202510/%E6%95%99%E8%82%B2%E4%B8%AD%E7%9A%84AI%E6%99%BA%E8%83%BD%E4%BD%93%E5%A6%82%E4%BD%95%E7%94%A8-AI-%E5%B9%B2%E6%AD%A3%E4%BA%8B--%E7%9F%A5%E8%AF%86%E9%93%BA/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com