返回文章列表
AI

AI Agent 可以做外教吗?怎么用 AI Agent 造出高质量外教?

熠熠
2025-11-19
1小时前
AI Agent 可以做外教吗?怎么用 AI Agent 造出高质量外教?

最近,斑马口语正式上线,用纯 AI 外教与学生一对一全英授课,引发了行业不小的关注。

AI 口语并不是一条新赛道,其中的玩家也良莠不齐:既有像 Speak 这样重投入打磨真人视频的,也有大量给大模型「套一层皮」就匆忙上阵的。

斑马口语的目标,和其他公司则并不相同:斑马想要用 AI 打造一个超越真人的「AI 原生」口语解决方案。

这意味着,要让 AI 主导教学,让 AI 发挥出真人没有的能力:针对性的纠正,个性化的话题,还要真的对结果负责——不是增加一个练口语的功能,而是真的让学生在和 AI 对聊后获得提升。这是整个行业之前前所未见的。

这个挑战,不仅带来了技术上的难题,也需要对「教育」有极深的理解:比如,AI 教师如何真正激发孩子的兴趣?这背后都在考验团队是否具有真正的教学经验中积累的「手感」。

而比「手感」更深层的挑战,是组织力。一个真正的 AI 原生 Agent,诞生的前提,必然是一个「产模一体」的 AI Native 组织。这不只是一个产品问题,更是一个关于组织进化的「终极命题」。


01


比真人外教还会教的 AI 外教


口语外教是一个被验证过的需求,用 AI 代替真人外教,降低成本,很合理。但真正的难点在于:AI 如何能超越真人?

真人外教的局限性是天生的:他们会累、会忘、会不稳定,并且无法实现「千人千面」的颗粒度。而这,恰恰是 AI Agent 的机会。为了实现「200 分」的目标,斑马从几个真人无法企及的核心点发力:

首先,是提供即时、可交互的真实语境。

这个正如下面的案例所展示的,当 AI 老师想要教会小朋友生日派对相关的英语时,AI 能无缝切换到一个生日派对现场,聊孩子爱吃的派对食物。

AI 让这种高成本、一次性的「真实世界」体验,变得轻盈、可控且无限重复。

,时长01:14

除此之外,AI 还能实现真人无法企及的「高颗粒度的个性化进阶路径」。人脑的记忆是有限的,但 AI 的记忆是无限的。

斑马的 AI Agent 会把每个孩子当作一个系统来建设,它记得孩子上一次对话的每一个细节、每一个薄弱点。当孩子学口语遇到瓶颈时,AI 能设计出「微小的一步」,在下一次对话中推着他往前走。

这种「长期积累的陪伴」和「微小颗粒度的进阶」,是任何真人老师都无法规模化实现的。

第三点,或许有点出人意料,反而是 AI 的情商。

AI 做外教,肯定会有人担心,AI 毕竟是「假人」,孩子怎么会愿意和它交流?但斑马团队的数据显示,传统真人外教一对一,孩子前三分钟的开口率大约是 85%;而在斑马口语中,这个数字是 98.8%。这来自细节的打磨——比如一个细节是 AI 外教 Jessica 的形象。

在技术上,用 3D 形象配合 AI,其实比 2D 更成熟、更方便。但斑马反其道而行,选择了 2D。

「我们之所以选择二维,是因为 3D 角色,更像是模仿真人,容易产生恐怖谷效应,影响孩子『入戏』。」修佳明提到。「我们挖掘了过往真人外教的数据,抽象出了「孩子最喜爱、学习效果最好」的外教特征——包括脸型、发色,设计了 Jessica。」

但让孩子想开口只是第一步,斑马也希望用高情商让孩子更爱学习口语。

比如在前面说到的生日派对的课件里,一个正在学习的孩子突然说「我不想办生日 party」。AI 外教 Jessica 的回复同样情商极高,她说:「Of course you can say No. Some people like quiet birthdays. That's OK too.」然后无缝地将话题切换到「参加别人的生日派对」,把教学进度自然地延续下去。

这种永远稳定、充满耐心、人格统一、且总能「捧场」的灵活性,恰恰是真人老师难以做到的。它让 AI Agent 从一个「工具」,变成了一个孩子愿意分享秘密的「新物种」。

而这种「新物种」带来的信任感和情感连接,看似只是锦上添花,实则正触及了教育中最难的命题:动机。

如何让孩子有动力学下去?绝大多数教育产品,依赖的是「工具型动机」——奖励、打卡、游戏化。

但通过与这个孩子真正「想聊」的 AI 外教交流,学英语的动机就变了。孩子不会想「我说英语会给我带来什么奖励」,他想的是「我必须说英语,才能完成这件事」——和虚拟的老师、小学伴们交流。

学习的成就感内化于这个过程,最终让说英语成为一种「必须」和「自然而然」。


02


「产模一体」的最佳实践


当斑马团队立下这个「200 分」的雄心时,他们其实正站在一个十字路口。这个路口,就是技术栈的选择。

一个超越真人的 AI Agent,到底需要一个什么样的「模型」?

在 2023 年立项时,最「聪明」的捷径,就是「套壳」——要么用最强的闭源模型,要么用顶尖的开源模型。

但斑马团队很快发现,所有「捷径」都通向「80 分」的平替,唯独通向不了「200 分」的超越。

「我们很早就尝试过这个路径,」修佳明,但是最后发现,不同的模型,总会有不同的问题。这背后是数据白点(data blind spots)的影响,你通过人设或者其他工作是很难根治的。在教育场景下,语言的正确性是第一位的。」

更别提迭代的鸿沟——「AI 大模型,保守说每半年大模型的能力变化都很大,你选用一个具体版本的开源模型去做后训练,再去想跟上最新模型的效果,这个迭代的成本还是挺高的。」

而斑马真正的壁垒和核心资产,在于长期积累的、海量的、高质量的儿童教育数据——包括海量的儿童跟读数据。

于是,他们的路径清晰地浮现出来:「猿力大模型」(预训练基座)+「斑马独有教育数据」(后训练/微调)。

这种「产模一体」的价值是立竿见影的:

首先是数据带来的模型语料的准确和安全。

修佳明说:「我们做了更严苛的数据筛选,首先能保证语料都是标准的英文语料,而且内容是符合儿童认知的,且价值观要非常积极向上的。我们又做了一些强化训练来保证它更可靠。」

而更能体现产模一体的好处的,是AI 知道怎么和不同水平的孩子沟通。

我们在采访中聊到一个问题:AI 的知识是渊博的,但它怎么能「降维」跟孩子沟通?一个孩子问「为什么天是蓝的」,AI 会不会「吊书袋」,讲一堆大气折射和瑞利散射?

斑马的核心资产——过去积累的海量数据,能够教给 AI 如何正确地跟孩子的交流——孩子问「为什么」,可能只是想引起一个话题,他想得到的回答是更浅层的、一个比喻类的,他并不是想钻进去。

如果说「产模一体」是技术上的「必经之路」,那么一个更难的、也更底层的挑战,就是组织的重塑。

这,或许才是 AI 时代最核心的命题。

我们聊过太多团队,为什么「产模一体」最后跑不通?因为他们只有「产模」,没有「一体」。

模型团队和产品团队背着不同的 KPI,互相拉扯。产品经理(PM)的价值感在消失,他们不再是为用户创造产品,而是沦为「给模型找活干」的「传话筒」。

斑马是不是也遇到了类似的困惑?

「我们之前也有传统互联网的流水线分工,但我们做这个事的时候就乱了。」修佳明坦言。

「比如产品的需求文档(PRD),在新的产模一体的产品下,基本上就是一个课件。如果采用传统的流水线,产品经理所做的工作几乎就只是把教研的大纲『翻译』一下。我们最后坐下来聊了一下,教研和产研能不能一起干这个事?」修佳明说,「最终斑马口语的解决方案是,教研和产品研发直接一起讨论教学层面的需求,研发在一个看似非标准的需求下,进行理解和开发。」

这种「边界模糊」不止发生在产品和教研之间。「教研可能直接跟 AI 工程师对接;动画直接跟研发去对,因为这里面的渲染有点复杂……有很多是跨部门交错来做。」

一旦这个「壁垒」被打破,整个组织的形态就全变了。流程不再是「PM -> RD -> 教研」的线性传导,而变成了「神经突触」式的网状连接。

斑马分享了一个最朴素、也最高效的组织解法:「坐在一起。」在物理邻近的高密度协作中,「教研」的神经末梢直接碰上了「AI 工程师」的神经末梢,不断碰撞、擦出火花,形成新的组织脉络。

一个真正的 AI Native 产品,或许不是被「开发」出来的,而是被一个 AI Native 的组织中「长」出来的。

为了实现那个「200 分」的 AI Agent,你必须先打造一个「200 分」的 AI Native 组织。

这,或许才是斑马口语在「产模一体」实践中,最坚实、也最难被复制的「壁垒」。


03


用 AI 拆掉巴别塔


斑马口语已经证明,AI 可以成为一个比真人更稳定、记忆力更强、甚至情商更高的「老师」。但如果这只是一个开始,AI 语言教育的未来,又会走向何方?

在讨论中,修佳明为我们勾勒出了一条清晰的「范式迁移」路径。

我们最熟悉的,是「外语学习」:以规则为先,上来先学语法、背单词,把语言当作一个「学科」来攻克。

斑马口语目前所做的,是「第二语言习得」:它不先教规则,而是强调「沉浸式」输入,先让你听、让你读、让你模仿,在大量的语料中「习得」。但它依然需要一个起点——孩子需要有最基础的认知和一些英语基础。

而这条路的「圣杯」,是「母语习得」:像母语一样,在真实的、全天候的环境中自然习得,你甚至意识不到自己在「学习」。

斑马的目标,就是推动整个教育范式,从「外语学习」向「二语习得」迁移,并最终无限逼近「母语习得」。

「母语习得」的本质,不是「上课」,而是「生活」。

这意味着 AI 必须从一个「课程 App」,变成一个「存在」。而这一点,斑马已经看到了雏形。

修佳明提到,他们已经能感受到孩子的主动分享。「有一次说到今年的目标,孩子主动分享了已经吃了两个月的健康食物了,还是没有长高,并主动给 AI 学伴看自己的身高。」

,时长01:09

而要从「朋友」进化到「家庭成员」,斑马正在探索一个明确的方向:多模态理解,尤其是做更多的视觉理解。

一旦 AI Agent 有了「眼睛」,能够观察到孩子的反应、表情和所处的真实环境,它就拥有了「嵌入生活」的能力。

这带来了一个极具想象力的未来——当 AI Agent 可以成为一个真正的「AI 玩伴」,全天候沉浸在孩子的生活中:当孩子拿起一个苹果时,它会用英语说「Apple」;当孩子在玩乐高时,它会用英语讨论「Blue block」。一个真正的母语环境形成了,语言学习被彻底内化到了生活本身。

而这个「AI 玩伴」的未来,听起来遥远吗?

修佳明告诉我们,他们已经在斑马口语的「数据闭环」中,看到了这个未来的「涌现」。当一个 AI 产品拥有海量的真实用户数据,它就开始在各方面「成长」了。

单就语音而言,就能看出差别。「通过获得更多数据,AI 现在对小朋友不同的发音的判断比真人更准了,」修佳明说,「小朋友的口音或者本身年龄比较小,肌肉发育的原因等等,可能并没有办法像真实发音那样。但我们的产品不能因为学生发不出这个音,Jissica 就判定他不会。」

「你怎么理解语言学习这个事的终极目标?」在采访的最后,我们问道。

「我个人是希望语言学习如果能对每一个人的自我产生影响。」修佳明说,「学习一门语言,你也会学会它背后代表的世界观、思维、文化。而当你的认知提升了,你也能更好地与这个世界产生连接。」

当 AI Agent 把语言学习的成本和难度无限拉低,当每一个孩子都能拥有一个高情商、高智商的「AI 外教」时——

我们或许正在见证的,是用 AI,拆掉那座阻碍人类互相理解、互相启发的「巴别塔」。

本文内容仅供参考,不构成任何专业建议。使用本文提供的信息时,请自行判断并承担相应风险。

分享文章
合作伙伴

本站所有广告均是第三方投放,详情请查询本站用户协议