写好英语作文,几乎贯穿了当代人整个求学生涯。
无论是在校学生或职场人士,无论是备考高考、四六级还是雅思托福,你在整理学习技巧时就会发现,单词能借着写便签反复记忆,听力口语可以跟着美剧广播练习,但英语作文的提升往往举步维艰。
原因无非有三种,一是前期没有足够的高级词汇积累,二是创作时缺少清晰的逻辑思维,三是后期没有老师手把手指导修改。其中最难以实现的莫过于后期指导,好在随着 AI 技术的发展,近年来出现了不少英语作文批改工具,足以充当专项家教。
3 月 22 日,《网易有道词典》iOS 与 Android 版同步更新,从 2018 年起就被各家媒体频繁提及的「作文批改」功能终于在新版本中上线。借着体验这一新功能的机会,我们也将其与国内几款同类产品进行了横向对比,助你选出最实用的英语作文批改工具。
为此我们找到了网络上一篇 2019 年高考一卷英语作文范文,即李华暑假在伦敦实习时,想到当地美术馆做中国画展志愿者的申请书。在保证文章结构不变的情况下,有意为其增添了 14 个错误:
接着,将「注入灵魂」后的文章同样复制到几个产品中进行验证。
打开《网易有道词典》App,首页就有「作文批改」功能入口。里面提供了 8 种英语作文类型可选,包括小学、初中、高中、四级、六级、考研、托福、雅思,适用于 K12、大学、成人等全学段人群,不同学段的分数设定和评判要求与考试标准一致。
当然,如果你并不属于其中任意一种,也可以选择「通用」。
选择学段完毕,即可进入《网易有道词典》的「手动输入」,既能使用手机键盘写入文章,也可直接粘贴作文,输入框右下角还贴心地内置了单词数统计功能。
输入作文后「确认提交」,这篇作文的专属报告便会生成,有总分信息,也有对词汇、结构、语法、内容的多维度星级评定,评分模块相当齐全。
「作文详情」中,疑似有误的字词被标红,轻点便能查看错误解析。无论是大小写规范,还是名词/动词/冠词/介词/代词拼写错误,或是时态误用、词汇缺失/冗杂等语法问题,均被逐一点出并给予了修正建议。
还记得我们原本添加的错误个数为 14 吗?事实上,《网易有道词典》给出了 16 个修改点,除了 14 个手动加入的被全数揪出,对于「范文」中本身存在的错误,例如表示被动的「are wanted for」也被建议修正为「want」。
值得一提的是,即便同一个对象涉及多个错误,《网易有道词典》也可以全部识别,比如作文中的关于「important」的最高级形式错用。
而对于需要结合前后语境的复杂语法问题,更能够根据语篇识别句子时态上的错误,联系上下文查找不当用词,比如作文中的「Now I write to…」这句,now 意味「现在」,而「write」应该用现在进行时。
接下来,你就可以根据错误解析,随时点击「修改作文」按钮调整,并重新评分;或是选择「查看点评」,评语模块提供了全文评语、词汇推荐、佳文推荐等,有助于你了解问题并得以思维扩展。
▲ 左为修改作文,右为查看点评
将同样的作文,再录入到同类产品《Grammarly》《微软爱写作》《批改网》,这三款产品分别点出了 7、15、8 处错误。
其中,关于「Now I write to…」这类深层语法错误,《Grammarly》《批改网》均未点出;而即便找到了 15 处错误,《微软爱写作》还是为这篇作文打出了 23 分,评分略显粗糙。
▲《微软爱写作》
我们还列举了 3 个存在复杂语法错误的单句,在几款产品中进行批改对比,如下表所示。
差距很明显,《网易有道词典》能够通过原文语境做综合判断,如时态错误、动词原形与动名词误用等;《Grammarly》《批改网》则更偏向简单的语法修改,如介词误用,名词单复数错误等。
造成差距的原因很简单,《网易有道词典》本身的纠错模块就采用了「拼写纠错 + 语法纠错」方法,前者大多产品都能实现,而后者则需要用到 Transformer 架构等复杂核心技术,通过建立复杂模型实现针对不同场景进行性能调优。
再考虑到另外几款产品形态均为网页,作为移动应用的《网易有道词典》或许还能在便捷性上再加点分。
以下为「手动输入」环节最终评比结果。
对于绝大多数学生来说,写作通常都在纸上完成。因此,支持拍照并对手写字体识别批改,在特定情况下已经属于「刚需」。
App 形态的优势在这个时候就充分体现了,《Grammarly》《批改网》均不支持「拍照批改」,同为网页版的《微软爱写作》则采用了「上传图片」再识别的方式,仅有《网易有道词典》和《小猿搜题》能够直接拍照识别。
识别手写体,主要考验 OCR 技术。还是同样的「14 处错作文」,我们将其誊抄到了本子上,其中有写错划去的,也有加粗涂黑的。
使用《网易有道词典》拍照识别,速度快,且识别后不做任何修改的情况下,正确率也高。
很有意思的一点是,《网易有道词典》对于标点的识别相当执着,但凡逗号后没有加空格,或者句号后的单词首字母没有大写,就会被温馨建议,督促你规范书写。
对比用《小猿搜题》拍照识别,错误率较高,漏算标点更是常见,批改效果也不佳,包括那句「Now I write to…」等多处错误均未指出。
而作文内结尾段微微斜着手写上去的部分,《小猿搜题》识别后语序完全混乱。
《微软爱写作》的操作比较复杂,需要用手机相机拍照,将图片发送到 PC 上,再上传到网页内,这个操作就已经不太属于「拍照识别」范畴了。
因此在这一环节中,《网易有道词典》称得上是一枝独秀了。需要补充说明的是,以上都是依照直接扫描的结果来比较 OCR 识别效果,实际上三款工具都准备了识别后手动修改调整的步骤,支持自己先行修正再做批改。
总结
通过上述实验可以感受到,这个基于《网易有道词典》神经网络机器翻译推出的新功能,甫一亮相,其专业程度在国内产品中已属佼佼,可能比雅思托福老师还更「面面俱到」。
科学数据也证实了这一点。《网易有道词典》的「作业批改」功能与同类产品相比,精确率、召回率都处于领先。
最后,我们也对参与横评的 5 款产品进行了综合整理,便于更直观地了解各自特性。
顺便一说,目前《网易有道词典》中的「作业批改」功能以小程序形态存在,或许可以期待之后有更广阔的应用场景。