人工智能技术在线英语培训领域的应用,还有很长的路要走。
如今人工智能大行其道,各行各业都想贴上AI的标签,在线教育也是,各大公司都在凹出不同造型来和人工智能挂上钩,以抢占市场先机,赢得口碑与利润。然而,理想很丰满,现实很骨感。作为人工智能+的应用行业,尽管人工智能在在线少儿英语培训领域已经被应用在个性化教学、智能师生匹配、情绪识别、智能互动课堂、智能语音识别等,但智能相对论(微信id:aixdlun)仍然想提醒,这需要教育公司拥有强大的技术及研发实力的保障,然而这种实力并不是一蹴而就的,超高的门槛限制了教育公司引入人工智能的计划。
先天不足——英语培训相关大数据难获取
人工智能必须的养料——海量的、有效的数据难获取。教育公司得有足够的数据支撑人工智能深度学习的需要,包括英语知识大数据、语音数据、视频数据、学生行为数据等。数据采集后,通过清洗得到有效数据,然后根据教育公司学习系统要求,人工为图片、视频和语音内容打标签、做标记。标注好的数据才可以用来训练人工智能算法模型,然后应用到图像识别、语音识别、动作识别等不同的模块。数据越准确、数量越多,算法模型的效果就越好,产品的体验也会更近一步。
数据的规模和采集能力决定了人工智能在英语在线培训行业的发展速度。而在英语在线培训这个细分领域,21世纪出才开始出现,2010年以后才逐渐成熟,不过短短几年,且受限企业数据源相关设备影响,以及企业本身的对这类数据的关注度及科学技术的发展预见有限,原始数据积累本就不足,加之精细度不足,大规模的样本数据较难获取,更别谈数据的有效性和其标注的质量。
差强人意——用于评估学生英语水平的数据分类不合理
数据的分类与关联,关乎系统最终实现的效果。目前在线教育公司的分类,无论是个性化学习还是智能语音测评,都在粗分类的基础上实现的。如有教育公司采用CCSS教材(Common Core State Standards 简称CCSS,又叫美国共同核心州立教育标准,是由美国教育部以及哈佛、哥伦比亚大学等名校提出的,按照美国大学招生要求制定的教学大纲),它涵盖12年义务教育所有的学科内容,所以当使用人工智能技术评估学生的英语水平时,其分类也只是按各年级水平粗分为12类,且不说用语评估的题目是否精确,仅以此作为学生的实际水平去给其制定学习路径,未免有悖于千人千面的“个性化学习”的初衷。
数据挖掘和搜索算法对数据工厂中的知识库和信息库进行分类与关联的技术能力也是在线教育公司的一大痛点。数据存储在硬盘上,机器想要找到某个数据,必须一个个访问过去,机器没有分类的概念。如果需要机器理解用户的语言,这种搜索技术也依然要机器的大脑配合才能达到,对每一个词的定义应该是一个库,而这个库中的每一个词又都各自构成库,数据工厂所依托的搜索算法,就是在这么一个数据海洋中去为他们建立管理,然后去索引。数据工厂相当于人脑中的记忆关联过程:将某个词同时与其他词或是某个场景等等建立起动态关联的过程。这也是教育公司进入AI+领域的重要门槛。
力不从心——学生情绪识别所依赖的智能算法远不够智能
算法负责接收有关特定领域(例如学生掌握的所有英语单词)的信息,通过对输入的信息进行权衡做出有用的预测(此人的英语水平)。通过实现让“计算机自行学习的能力”,可以将优化方面的任务,交给算法负责。如对可用数据中的不同变量进行权衡,进而面向未来做出精确的预测。预测的准确性一方面取决于上文提到的有效数据样本量,另一方面取决于算法结构。
如个别教育公司将人工智能深度学习算法用于情绪识别,通过人脸识别技术,有效监测学生的接受程度、喜好、专注度、开心值等,通过大数据来全程追溯学生的学习过程,发现学生学习中的问题和喜好,进行有针对性的强化和补充,从而让学习效果更高效。情绪识别技术可以说是人工智能发展的最高水平,不论采用何种算法,目的都是让人工智能具有和人类一样的思维能力,可以分辨情感。
情感是人类神经系统对外界价值关系产生的主观反映。这种反馈由大脑首先发出指令,进而影响人的面部表情、声音高低和语速以及其他肢体语言,还会影响心脏、四肢等器官,也影响大脑本身。当然,人的内心状态又与先天因素和成长经历有关,所以面对同样的外部变化,不同的人会产生不同的情绪。 判断情绪、看出眉眼高低,对于人类来说,可能连不会说话的小孩都能做到。可是,这个能力却是目前人工智能的最高水平。也就是说,人工智能发展的水平还没有足够高,使机器人可以更像人。面对人类情感这个异常复杂且人类自身都没有完全弄懂的问题,人工智能还有很长的路要走。
所以在线教育公司提出的情绪识别,识别的精确度有待验证。而将这种不确定的预测结果应用于学生的个性化学习,为其制定独有学习路径或者提供任何的学习建议,难免会有人质疑:前提都不一定正确,结果会对吗?情绪识别只是教育公司AI应用的冰山一角,其他类似的应用都存在或大或小的问题。
一将难求——AI优质人才紧俏难得,教育公司鲜有优势
当前,人工智能领域的竞争,主要体现为人才之争。
只有投入更多的科研人员,不断加强基础研究,才会获得更多的智能技术。人工智能技术的开发与应用,不光需要依靠研发费用和研发人员规模上的持续投入,还应该加大基础学科的人才培养,尤其是算法和算力领域,而很多高校在很长时间内并没有人工智能专业。这也就造成了国内人工智能人才紧俏,各大互联网公司的人才抢夺战尤为突出。作为互联网的一个细小分支,在线教育公司如没有强大的综合实力,很难获得优质人才。
小结
人工智能技术在线英语培训领域的应用还有很长的路要走。在数据积累层面,未来,大数据时代来自全球的海量数据为人工智能在少儿英语在线培训的的应用提供了良好的条件,在不久的将来将不成问题;人工智能的灵魂——智能算法还得依赖于人工智能技术的持续发展继续优化得到适用于英语在线培训的最优算法;而人才,在线教育公司或许只有是行业领军企业才有资格加入人工智能人才抢夺战,后来者唯有高薪聘请或文化吸引,才可能有一席之地。