作为掌握着大批用户信息的科技巨头,FAANG 注定无法摆脱 " 隐私门 " 的负面影响,这次被曝光的是 Amazon。
据彭博社报道,七名曾经参与过亚马逊 Alexa 语音识别系统改进项目的员工透露,这款产品背后的语音识别服务自动录制了使用者的部分对话,并发送至亚马逊设立在海外多地的工作站,进行人工识别与标记。
Alexa Internet 现为亚马逊旗下的子公司,该公司于 2014 年开发了一款智能音箱,取名为 Echo,Alexa 便是该设备上所搭载的语音识别系统,该产品可通过与用户之间的语音交互,帮助用户完成通话、查找资料、点外卖、叫车等多种生活琐事,仿佛一个无所不能的私人助手。
但本次 " 隐私门 " 事件似乎恰恰证明了这款产品并非无所不能——至少它的学习过程还离不开人类的全力辅助。
危险的 Alexa:一言不合随时开 " 录 "
早在去年,纽约时报就曾揭露过 Alexa 的重大漏洞,当时,Alexa 在一对夫妇的对话中错误地识别到唤醒词和一系列指令,并将两人的对话内容自动发送给了丈夫的一名雇员。在另一起事件中,Alexa 错误地识别到用户的指令,并自顾自地发出令人毛骨悚然的笑声。
这是自动语音识别的缺陷所在,也是亚马逊需要工作人员进行人工辅助的原因。
为了有效识别唤醒指令,Alexa 可能任何时候都在工作状态中,并用其配备的七个麦克风同时捕捉周围的一切对话内容:
当您想要使用 Echo 时,只需说出唤醒词 "Alexa",Echo 就会亮起并将音频流传输到云端,利用 Alexa 语音服务即可识别并立即响应您的请求。
另根据 Echo 的官方常见问题解答,亚马逊称,系统绝不会在没有得到用户允许的情况下开始录音并上传至云端:
默认情况下,Echo 设备只能检测您选择的唤醒词……除非设备检测到唤醒词 ( 或按下按钮激活 Alexa ) ,否则不会存储或发送音频到云中。
但令人不安的是,本次事件中包括录音、转录、识别、反馈在内的一系列工作,都是在用户所不知情的情况下秘密完成的,其内容涉及到办公室对话、家庭聊天、个人私密信息甚至犯罪现场等多个方面。
爆料员工称,他们所监听到的录音中,有相当一部分并非在识别到有效唤醒词后才开始录制,很多音频文件以难以识别的各种噪音开始。
亚马逊:所有信息都高度保密
七名爆料员工所处的团队人数高达数千人。他们的工作是收听 Alexa 传回的录音文件,对系统无法自动识别的模糊语音进行人工识别,对存在歧义的指令进行解析并标记,随后将处理过的内容反馈至 Alexa 系统,以帮助系统在未来的工作中更好地完成机器语音识别。
尽管这些员工彼此可以互相交流所监听到的内容,但好的方面在于,亚马逊所收集到的音频相关信息中并不包括用户的真实姓名及地址,仅有 Echo 设备序列号等基本信息。
据彭博社援引亚马逊发言人称:
我们有严格的技术和操作保障措施……员工不能直接访问作为工作流程一部分的个人或账户标识信息,所有信息都别高度保密。
同时,相关员工透露,该项目系保密项目,由亚马逊全职员工和外部承包商共同完成,工作地位于波士顿、哥斯达黎加、印度和罗马尼亚等多个地区,并没有外部标志显示出当地为亚马逊的办公地点。
由于亚马逊对音频文件的使用相当谨慎,本次事件尚未被定性为侵犯用户隐私,但科技巨头三番五次地陷入 " 隐私门 " 已经足够引起公众的重视。在去年 Facebook" 隐私门 " 事件中,Facebook 泄露了超过 5000 万名用户的个人数据,这些信息被剑桥分析(Cambridge Analytica)用于向用户推送定制广告,引发轩然大波。
去年在国内,也时常有淘宝、饿了么用户反馈称,APP 界面的推荐位上出现了他们最近刚刚与他人讨论过的产品。在相关平台对监听用户对话予以否认后,手机 APP 是否可以通过启用麦克风权限自动监听成为了一个未解之谜。
AI 时代无隐私,在追求计算机比我们自己更加了解自己的过程中,使用者或许不得不牺牲一部分隐私。正如亚马逊在 Echo 的描述中所说的那样:
我们使用您对 Alexa 的请求来训练我们的语音识别和自然语言理解系统。我们用来训练这些系统的数据越多,Alexa 就能工作得越好,用来自不同客户的语音记录来训练 Alexa 有助于确保 Alexa 面对每一个人都能工作得很好。
但这个所谓 " 机器学习 " 的过程,事实上有相当一部分来自于几千名亚马逊 " 秘密工作组 " 员工的人力协助。
来源:华尔街见闻