微信“看一看”的出发点是改善用户对订阅号的阅读效率,本文作者围绕“内容”、“用户”、“用户—内容连接通道”,从推荐特征及推荐的可解释性两个方面分析“看一看”的推荐系统,并提出了改进措施。
2017年字节跳动公司旗下的今日头条和抖音APP的火爆,让人们领略到推荐系统的强大。而如何做到“千人千面”,如何做到推荐给用户是他真正喜欢的而不是他之前已经浏览过的,更甚者是如何帮助用户发现他的爱好,从而改善用户的阅读效率,这都是推荐系统应该做到的事情。
一个好的推荐系统,笔者认为主要有以下四个核心内容:
内容:内容数量、内容特征;
用户—内容连接通道:用户浏览内容时产生的反馈,如阅读、点赞、评论等;
算法:根据不同的特征及策略要求对不同的算法进行迭代,如协同过滤、逻辑回归等。
其中,作为资讯类的推荐系统PM,除算法需要由算法工程师来负责完成外,剩下三点PM都要和工程师或者编辑共同完成的。推荐内容质量的保证,少不了PM的跑前跑后啊。
微信“看一看”的出发点是改善用户对订阅号的阅读效率,让用户更快地进入到内容里,本质上充当着基于推荐系统的新闻资讯类产品的功能。
本文接下来就以“看一看”为例,围绕“内容”、“用户”、“用户—内容连接通道”,从推荐特征及推荐的可解释性两个方面分析其推荐系统现状及改进措施,以达到改善用户阅读体验的目的,做到推荐的“千人千面”。
一、推荐特征
近几年,深度学习的大火,在很多领域都实现端到端的学习(如图像、语音等),但是在推荐系统这个领域王国,特征工程却是必不可少的。
通过笔者的体验,微信“看一看”采用的特征主要有以下几点:
1.内容特征
与其他新闻资讯类产品相同的是,微信“看一看”在内容形式上有图文、视频等,在属性划分上采用典型的层次化文本分类算法;而不同的是,其内容特征除了有图文内容特征外,还具有公众号的属性特征,从而将内容与内容背后的账号进行连接。
“看一看”根据用户目前已关注的公众号、公众号内容及用户的浏览记录等反馈行为,预测用户感兴趣的内容类型,进而帮助用户去更快地到其所感兴趣的内容。
2.用户特征
用户特征指用户的画像,如用户的年龄、性别、地理位置等,不同特征下的用户感兴趣的内容也是不同的。
3.热度特征
微信“看一看”有热门话题和要闻这两种属性特征,热门话题是公众号里讨论最多的热点话题,要闻、24小时新闻的内容多来自腾讯新闻。
4.协同特征
与其他新闻资讯类产品不同的是,微信本身发挥着即时通讯的功能,用户的社交关系链自然就成为其推荐系统的一个重要的属性。推荐系统不仅给用户推荐其所感兴趣的内容,还挖掘“朋友都在看”、“朋友圈热点”等信息,将好友属性和公众号属性进行叠加,避免了越推越窄的窘迫。
微信“看一看”目前依靠以上四种特征,发掘用户的喜好,给用户推荐其感兴趣的内容,进而提升用户的阅读效率。
智能时代,用户每时每刻都在产生信息,推荐系统可以利用的特征也就更多。对此,除以上特征外,笔者认为微信“看一看”还可以采用的推荐特征如下(红色部分):
(1)协同特征
在即时通讯方面,与QQ不同的是,微信更多的是履行着熟人社交的职责。
熟人,即具有相同价值观、相同兴趣爱好的社群,而熟人(朋友)又可细分为经常联系的与不经常联系的,经常联系的朋友对于用户的阅读行为具有指引作用,用户也会趋向于获得与经常联系的朋友相同或者相似的资讯信息。
因此,对比微信之前的协同特征,可以将好友属性细分为经常联系好友与不经常联系好友,进而在推荐算法上为不同的好友属性设置不同的权重。
(2) 环境特征
工作、通勤、旅游,用户所处环境的变化,对当时浏览的内容也会有所差别。
而这一属性的数据通常无法直接获得,需要结合算法策略分析多个属性的相关关系,从而生成环境特征,如通过微信支付获得的用户购买信息(购买车票、旅游门票等)、用户地理信息的变化等可以预测出用户目前所处的环境,进而可以给用户推荐所处环境相对应的内容。
二、推荐可解释比精准更有意义
智能时代,推荐系统的“千人千面”不仅体现在推荐内容的差异,还体现在推荐理由的表达方式的不同。
对新闻资讯类产品来说,推荐理由是为了让用户知道每一项推荐项目是怎么得到的,从而说服用户接受产品的推荐,这在改善用户阅读体验上是有一定意义的。
吸引用户点击阅读的因素有标题、来源、缩略图、推荐理由等,这些因素的本质是给用户一个点击的理由。用户是懒的,在推荐理由精准、合理的情况下,才能够真正“智能”地帮助用户快速找到感兴趣的内容。
微信“看一看”目前已有的推荐理由形式如下:
“看一看”基于用户的兴趣、热点、社交/协同过滤的群体来生成推荐理由,这些推荐理由在辅助用户产生浏览行为上有一定的促进作用,但是却并没有做到真正的“千人千面”,因为其对不同用户的推荐理由的表达方式是相同的。
智能时代,推荐理由的“千人千面”应该体现在不同用户的特异性上,即推荐理由的人性化、个性化。同样的推荐理由,结合目标用户的属性、习惯以及内容的上下文环境,可以生成不同语言的表达方式,如有些用户可能更喜欢卖萌的方式,有些用户更喜欢严谨的方式,这样的推荐理由,才是真正的“千人千面”。