人工智能鉴黄技术正从传统的图片、视频、文字,趟进语音鉴黄这片蓝海。记者前几日获悉,阿里AI语音反垃圾服务上线公测,它可以通过声纹识别技术,识别语音中存在的涉黄、广告等违规信息。
这项服务不仅可以识别中文、日文、英文、俄文等多国语言,还可以识别湖南、湖北、河南、东北、四川、广东等地方言。
在日常生活中,阿里AI语音鉴黄服务支持离线文件和实时语音流。阿里安全部技术人员介绍,对那些有语义的内容,系统先将语音识别转成文字,然后再将这些文字跟文本反垃圾模型或关键词库比对,判断是否涉黄。对那些无语义的声音,通过声纹也能识别出来。
当然,识别多国语言和多地方言的能力,需要进行训练学习。“可以把它想象成一个机器人,像一个小孩,需要不断的喂养、训练、学习,它才具备这样的能力。”阿里安全部技术人员介绍,比如广东话,可以用一些粤语电视剧来训练学习。
今年6月,全国扫黄打非办通报,多个网络平台上存在以ASMR(即自发性知觉经络反应,主要产品为声音内容,用于放松、助眠)形式传播低俗甚至淫秽色情的问题。解决类似这种社会问题,人工智能语音鉴黄技术未来大有可为。
来源:科技日报