据国外媒体报道,美国联邦执法部门和情报机构在网上发布的信息征集启事显示,美国政府正在寻找一款能够分析社交媒体海量数据,并预测未来恐怖主义袭击和国外暴乱等重大事件的软件。
寻求分析社交媒体数据的软件
目前,已有数百名情报分析师在分析Twitter和Facebook上的海量帖子,跟踪诸如“阿拉伯之春”的革命活动。
但是,在最近面向潜在合同商发布的一份正式“信息征集启事”中,FBI透露它希望借助数据工具来扫描和分析整个社交媒体中的庞大数据。美国国防部和情报局总监办公室(Office of the Director of National Intelligence)也已向私有企业求谋良策,希望利用社交媒体上人们每日共享的数十亿条帖子来识别可能会发生的突发事件,例如恐怖主义威胁和骚乱活动。
“社交媒体已逐渐成为人们谈论危机事件的首选平台。它比传统的应急者如警察、消防员、急诊医生和新闻记者的反应更为灵敏。”FBI在其信息征集启事中写道,“在报道和应对危机中,社交媒体比911服务更胜一筹。”
这项提案已激起了人们对于隐私问题的担忧,他们担心这样的监测活动可能会让用户感到毛骨悚然。电子隐私信息中心(Electronic Privacy Information Center)开放政府项目主管金杰-麦考尔(Ginger McCall)称,若没有明确的执法目的,FBI无权监测合法的自由言论。“你无时无刻不在担心联邦政府会跟踪监听你的每一句话,这样你的说话和行为方式就会受到影响。”麦考尔说。
FBI在发给美联社的一项声明中称,他们的监测系统只是为了监测公众信息,不会针对某一个具体的人或组织,而只会针对与犯罪行为相关的言论。
分析公众信息早已不新鲜
在情报界,分析公众信息并不是什么新鲜事。例如,在冷战时期,美国中央情报局(CIA)的特工人员就经常阅读俄罗斯新闻报纸,拦截他们的电视和广播节目,企图推断苏联领导人正在想什么。
但是,在过去几年中,社交媒体的崛起极大地改变了公众信息的数量和类别。Twitter CEO迪克-科斯特罗(Dick Costolo)在最近一次会议中声称,该微博网站的用户平均每三天发布10亿条消息。
“现在是收集情报的黄金时代,因为所有人都在自觉自愿地表达他们是谁。”CIA前分析师罗斯-斯塔普勒顿-格雷(Ross Stapleton-Gray)说。在20世纪90年代初,格雷供职于CIA总监办公室。他现在是一名技术顾问,为公司提供安全、监控和隐私等方面的建议。
格雷声称,美国情报机构早期收集互联网信息的努力,遭到了一些元老级人物的阻扰,他们坚信机密信息比任何人均能够获取的互联网信息更有价值。但是,这些机构寻找最佳社交媒体分析工具的做法表明,这种阻力已经大大减弱了。
预测未来
美国情报局总监办公室下属的研究部门致力寻找的软件系统,将会融合网络研究到维基百科编辑到流量监控等各种功能,而且将能够预测未来可能发生的重大事件,包括从经济混乱到瘟疫爆发。
美国国防部寻找的工具将跟踪社交媒体,监测那些可能影响作战士兵情绪的信息的传播,并让军方在社交网络上执行“有效的网络作战方案”,打击各种敌对活动。美国情报局总监办公室和国防部声称,他们不会在美联社要求的期限内回答有关这项提议的具体问题。
FBI正在寻找一款网络应用程序,这款软件必须能够自动地挖掘社交网络,寻找有价值的线索,从而让该机构能够在犯罪分子在谷歌地图等界面上搞阴谋破坏活动的时候,能够及时地出面制止。
技术难题
要让这样的系统发挥作用,开发者将需要攻克几个技术难题,其中最简单的一个挑战就是处理海量的数据信息。“云计算”技术的发展,让处理海量数据变得比以前更为简单。该领域的专家称,现在主要的障碍是教会电脑识别信息。要从海量信息中淘出有价值的信息,软件必须理解Twitter消息和博客文章中每句话的细微含义,从而区分真话和玩笑之间的差别。解决这样的问题需要研究者了解自然语言处理和计算语言学,这种学问催生了苹果iPhone中的语音助手Siri和IBM的沃特森超级电脑。
在2009年猪流感爆发期间,位于美国旧金山的Linguastat公司曾与美国疾病控制中心(Centers for Disease Control,简称CDC)合作,在社交网络上跟踪监测了公众的恐慌情绪,并确认了CDC发布的公众健康知识是否引起了人们的注意。
该公司的联合创始人约翰-皮埃尓(John Pierre)称,我们跟踪公众情绪的方法主要是在社交媒体上搜索某些特殊的词汇或短语。“既然他们提到了猪流感,那么他们是喜欢还是不喜欢呢?他们这样说喜欢的语境正确吗?他们不会是在说一个叫做猪流感的乐队吧?”皮埃尔说。
在分析社交网络的过程中,真实性也成为一个问题。名为“僵尸网络”的计算机程序总是会在像Twitter这样的网络上发布类似垃圾电子邮件的垃圾信息。研究员蒂姆-黄(Tim Hwang)曾描述过僵尸网络对社交网络的巨大影响,并声称创造僵尸网络模仿人类行为的技术将会越来越先进。
这一点在情报收集工作中至关重要,因为僵尸网络可能会蒙骗分析师——及其软件,让他们误以为社交趋势发生了变化,而实际上这种变化可能只是由并不存在的Twitter用户操作的结果。“我们掌握了全部的数据,但是我们如何知道哪些是真的,哪些是假的呢?”蒂姆说。
美国国务院前任官员、海军分析中心(Center for Naval Analyses)现任分析师威廉姆-迈坎茨(William McCants),负责监测网上的“基地”组织的宣传片。他声称担心FBI和其他机构寻找的系统会让他们过度地依赖于技术,而不重视培训人类分析师。目前,人类分析师仍然更擅长于鉴别最重要的细节。
“你使用的数据越多,软件越复杂,你得出的结论就可能越平庸。”迈坎茨说,因为朋友之间喜欢开玩笑。“你不一定要登陆Twitter才知道埃及正在进行革命。”