数据显示,从2003年到2018年的15年间,美国五分之一的报纸都停产了,这导致全美3143个县中的一半都只有一家本地报纸,甚至还有200多个县完全没有本地报纸。
本地新闻的锐减,与数字新闻的快速发展不无关系。目前,大约90%的美国人通过在线方式获取本地新闻,其中一半的消费行为都发生在移动设备上。数字信息消费已经超越了传统电视,成为最受欢迎的本地新闻获取途径。
即便许多本地媒体早已“上网”,但海量的新闻内容聚集在数字平台上,网络流量和受众信息消费的选择在很大程度上就得取决于数字平台的算法规则。
为此,一些学者已经对某些平台进行过研究,评估平台所获取的信息与呈现给用户的信息之间的关系,但涉及到新闻聚合平台的算法和本地新闻获取之间关系的研究几乎还是空白。以往也有一些研究表明,在线平台会过度呈现少数头部新闻媒体的内容,对于消费者的真实兴趣偏好却不那么敏感。真的是这样吗?
本期全媒派(ID: quanmeipai)编译Sean Fischer、Kokil Jaidka和Yphtach Lelkes三位作者发布在自然科研期刊(Nature Research)上的论文,以Google News为研究对象,试图从本地新闻媒体的式微入手,评估美国数字平台巨头的内容策略对本地新闻事业的影响。从这篇论文的结论中,或许也能感受到,种种看似正常的内容呈现,其实都是精心计算后的结果。
假设:Google News的检索推荐策略
Google News是美国最大的在线新闻聚合器之一,其用户群体触及全美人口的15%,和《华盛顿邮报》的读者体量不相上下。为了系统地证明美国本地新闻衰落与Google News的策略之间具有因果关系,研究者提出了一系列的假设:
如果Google在新闻曝光的选择上明显偏向于全国性的新闻媒体,就可以证明本地新闻的流量的确会因此减少,从而在一定程度上减少了用户阅读本地新闻的机会。
· 假设1(H1):比起本地新闻媒体,Google News更倾向于给全国性的新闻媒体更多流量。
Google可能会通过检索词对检索结果进行分层,基于此,研究人员提出了假设2。
· 假设2(H2):Google News优先将常规话题的流量给到全国性媒体,将地区性话题的流量给到地方性媒体。
从供需平衡的角度来看,当一个地区有更多本地媒体时,Google News理应提供更多本地新闻。在受教育程度较低或平均年龄较大的地区,Google News也应当提供更多本地新闻——因为本地新闻报道越多,这些人群越将从中受益。
· 假设3:Google News对地方的信息供给和需求是非常敏感的。
结论:平台策略对本地媒体不太友好
研究人员根据以往的文献选定了一系列的新闻关键词,根据这些关键词与本地的相关性,将它们标记为“地方性话题”或“常规性话题”。地方性话题代表本地属性强的话题,比如学校、医院等人们在本地比较关心的关键词;常规性话题代表国内属性强的话题,比如总统、枪支等全国都比较关心的关键词。
研究人员核查了美国超过3000个县的本地新闻检索结果,爬取了来自8740家媒体的1229万余条信息,这些信息的媒体来源也被标记为本地性、区域性、全国性和国际性。
从媒体出现频率看Google News的偏向
为了检验假设1(比起本地新闻,Google News更倾向于给全国性的新闻更多流量),研究人员计算了通过相关关键词检索所得到的新闻信息,并且测量了本地和全国新闻相关检索词分布的基尼系数。
计算结果显示,三个最主要的全国性媒体占据了检索结果的16.4%。(注:基尼系数是度量不平衡现象的指数,范围分布在0-1之间,取值越大代表不平等现象越严重。)
根据特定新闻检索词检索相应的新闻,得到的结果中媒体来源的分布图如上所示,排在前三位的分别是:《华尔街日报》、今日美国、BBC新闻
以上分布图较为明显地呈现了检索结果中媒体来源分布的不平衡现象,基于此,研究人员进一步使用基尼系数进行量化,对数字平台的内容信息进行了计算之后,高达0.82的系数,说明媒体所获得曝光的巨大差异。假设1得以证实,即Google News更偏爱全国性的媒体,常规性的新闻检索词在检索结果中高度集中,本地新闻则成为了牺牲品。
研究人员对不同类别检索词的基尼系数进行了度量,a组代表地方性检索词的基尼系数;b组代表常规性检索词的基尼系数。常规性检索词返回的检索结果在媒体来源的分布上更加不平衡。
新闻排序暗藏玄机
针对假设2(Google News优先将常规话题的流量给到全国性媒体,将地区性话题的流量给到地方性媒体),研究人员通过测量几个常规话题关键字和本地话题关键字检索结果子集的基尼系数,评估上述发现是否受检索词自身性质的影响。
数据表明,不同检索结果返回的媒体数量并没有实质性的差异,但是不同检索结果中本地新闻媒体的出现次数差异很大,而几个全国性的媒体却在每次检索结果中都有出现。
研究人员希望Google News在检索地方性话题时强调本地新闻媒体的报道,在检索常规的一般性事务时优先展示出全国性新闻媒体的报道,因此对地方性和常规性的话题关键词进行了检索,返回结果的构成情况如下图所示,这似乎与研究者的预期一致。
地方性检索词和常规性检索词的媒体来源比例分布图。地方性检索词得到的结果更多来自于地方性媒体,常规性检索词得到的结果更多来自于全国性媒体。
但如果对人们的检索行为加以考虑:大部分用户只看检索结果的第一页,三分之一的用户只看检索结果的第一条,那么将所有的结果都纳入统计的范围并不准确。因此,研究人员对检索结果进行了过滤,仅分析排名靠前的检索结果,计算了每次检索中本地媒体和全国性媒体出现的相对频率。
检索结果中媒体出现的相对频率图:实线代表本地媒体,虚线代表全国性媒体;紫色标签代表地方检索词,橙色标签代表常规检索词。
相比之前,过滤后的数据显示,在地方话题检索词的媒体来源中,本地新闻媒体出现的相对频率有所下降,即使对于“天气”这种与地区高度相关的词语,本地媒体在搜索引擎前十位检索结果中所占的比例也不及全国性媒体。在检索常规话题时,得到的结果就更加明显了。也就是说,即使Google News中有本地新闻媒体的内容,用户也可能要划好几屏才看得到。
因此,从整体数量来看,假设2在某种意义上是成立的,即对于常规话题,Google News的确会给到更多全国性媒体的内容,对于本地话题,则会提供更多地方性媒体的内容。但如果考虑到排序先后所带来的曝光分配问题,本地媒体依然是吃亏的。
更高的需求并不意味着更优的推荐
随后,研究人员通过考察全美县级媒体中地方性、区域性与全国性媒体的比例变化,对假设3提出的地理与人口等因素进行了检验。
如果光看检索结果的媒体构成和地理位置,似乎并没有实质性的空间关系。为了验证假设3,研究者测试了Google News是否会对本地的供需情况变化有所响应。
特定检索词检索结果中地方性媒体和区域性媒体的份额分布图
为此,研究者建立了一个线性模型,对检索结果的来源(本地性、区域性、全国性媒体)、检索结果的位置排序、检索词的类型(地方性或常规性)、本地新闻的供需情况等指标进行了回归分析,每个县的人口、年龄、收入水平、种族组成、教育程度和互联网访问情况则被纳为控制变量。
如下图所示,大部分指标与搜索引擎返回的媒体属性之间没有显著的关系,而显著相关的指标是检索结果的排序和检索词的类型。
当地人口数、报纸数、年龄中位数等因素与本地性、区域性媒体出现概率的相关系数(排除交互效应)
随着检索结果的排序逐渐靠后,人们看到本地性、区域性媒体的可能性增大。此外,县的总人口数与本地性、区域性媒体出现的可能性呈现负相关,即人口越少,本地媒体出现的概率越高,但从最少的县到最多的县,本地新闻出现的概率也只是降低了0.34%。
当地人口数、报纸数、年龄中位数等因素与本地性、区域性媒体出现概率的相关系数(考虑交互效应)
此外,由于检索词本身的重要性不同,可能会影响检索结果,研究者重构了模型,增加了通用检索词和变量之间的交互作用,结果如上图所示,报纸流通量和检索结果中出现地方新闻媒体的概率呈现正相关,流通量每增加一个标准差,本地媒体报道的新闻就会多出现2800次。
和前一个模型有所不同,某些县的人口统计学特征和媒体出现的频率具有显著的相关性:居民平均年龄越高,本地新闻在检索结果中的出现频率越低;居民受教育程度越高,本地新闻在检索结果中的出现频率则越高。
这些结论推翻了研究人员的第3条假设,即平台其实对于本地市场用户的供需情况并不是非常敏感。
以上模型也基本印证了Google News算法会加剧媒体市场中的流量资源分布不平衡的观点,与全国性媒体相比,本地媒体的权重相对较低,也就意味着用户难以从出现频率较低的本地新闻中获取信息,马太效应会愈加凸显。
用户兴趣要为检索结果背锅?
最后,为了解Google News的算法设置是否是因为用户对本地新闻不感兴趣,研究人员通过收集特定词语在Google Trends的数据,将用户对本地性话题和常规性话题的兴趣进行了对比。
研究人员比较了美国新闻查询行为的检索词是更加地方化还是更加常规化,意在研究用户的日常行为与本地新闻接触的可能性大小。结果表明,相比常规性的新闻,用户似乎对本地性的新闻有更高的关注。
这至少意味着,在发生重大事件的时候,用户会对常规性的话题更感兴趣。但在平时,用户是有兴趣了解本地相关信息的,而不至于完全不想看。所以,用户兴趣显然也无法为平台提供的不太平衡的检索结果背锅。
思考:谁来为本地新闻的衰落买单?
上述分析表明,Google News的用户接触全国类新闻及媒体的几率比接触本地类新闻及媒体的几率要高得多,这是因为检索常规话题的用户会被直接导向全国性的媒体,而只有特意搜索本地政府、公共服务等与区域相关程度较高的词语,才会在排名不那么靠前的检索结果中发现本地新闻及媒体的身影——但一般用户只看检索结果的前几条。
除此之外,一些可能会影响本地新闻出现的因素,比如某个县的报刊数量、流通情况等,并不影响本地新闻及媒体在搜索引擎出现的频率。
由此可以判断,Google News算法对用户本地新闻的供应和需求并不敏感,而研究人员对Google Trends的分析却表明用户对地方话题比对常规话题更感兴趣。
Google News设置这样的检索策略和推荐策略,自然有其原因,比如全国性媒体更有说服力、内容表现上更优质,抑或者常规类的新闻能够触达的用户群更广,而本地新闻只能吸引一小部分人群……这种情形,其实不仅仅出现在美国,更不是Google News独有,多数商业内容平台可能都会有类似的考量。
只是,这种现象为我们理解本地新闻及媒体为何会消亡提供了一条新思路,平台非恶意的内容策略,可以轻悄悄地将用户的注意力从本地新闻转移去常规领域,用户注意力的转移则会放大算法对本地新闻需求的不敏感。
循环往复,本地新闻生产、流通和经营的环境加速恶化。只是,如果本地媒体消亡了,本地新闻的需求却得不到填补,那么用户在本地的诉求无法表达也无从获知,最终需要为此买单的仍是用户。
文献链接:
https://static-content.springer.com/esm/art%3A10.1038%2Fs41562-020-00954-0/MediaObjects/41562_2020_954_MOESM1_ESM.pdf