本文针对刚起步与用户量不大的UGC内容社区,分享了两种基于内容热度的推荐展示规则,同时结合了目前几大UGC内容社区案例进行展示。
首先科普一下社交产品、社区产品、UGC、PGC的含义:
社交产品:以沉淀用户关系链为主,体现在:如何让用户之间建立关系、保持关系、升华关系;
社区产品:以沉淀内容为主,体现在:如何让用户生产、消费内容,如何为用户呈现内容;
UGC:指用户原创内容平台,如抖音、知乎、Instagram、小红书、IN;
PGC:指专业化、规模化生产内容的平台,如爱奇艺、优酷、早期的腾讯新闻。
以上分别为Instagram、小红书、即刻的内容信息流,分别代表了UGC内容社区三类典型的布局方式:纯图片信息流、图文缩略信息流、图文详情信息流,在数据层面它们都有一些相似特征:
每次下拉刷新内容会变化;
内容几乎不会重复出现;
内容的点赞、转发、评论等数据都相对较高。
以上方App内容信息流为示例,分享2个基于内容热度的推荐展示规则,适用于刚起步与用户量不大的UGC内容社区,抛砖引玉,仅供学习与交流。
热度随机曝光规则
方案目的:
热度高的内容应得到高曝光;
尽可能多的向用户曝光内容;
应用场景:
发现、推荐、探索类信息流。
上图是小红书的内容详情页,包含有点赞、收藏、评论、转发这些基本数据,所以我们需要拿到这些数据设计规则并进行排序计算,如果想把规则做得更精准,则可考虑把页面停留时间、页面跳出率等埋点数据纳入计算。
热度排序
首先判断:点赞数高低,更高的靠前;
如果点赞数相等:判断收藏数,更高的靠前;
如果收藏数相等:判断转发数,更高的靠前;
如果转发数相等:判断评论数,更高的靠前;
如果评论数相等:判断发布时间,发布更早的靠前。
排序规则的判断指标、先后顺序,都可以根据实际业务调整。
数据过滤
在所有作品中,取出发布时间在5天内的作品,挑入备选池;
对备选池里所有的数据,使用热度排序规则进行排序计算;
取出排序后数据中排名前20%的作品,挑入曝光池;
如果排名前20%的作品数量,不足曝光池限定的最小数量如400,则应把另外80%的作品,按排名依次填充到曝光池中,直到满足最小数量要求。
如果不设定曝光池的最小数量限制,则可能导致计算后的数据不足,内容无法饱和填充。
经过以上步骤,就过滤出了社区中一段时间内热度较高的作品数据,其中5天,20%,400这3个参数,可根据实际业务调整。
刷新机制
方式1:每 x 小时执行一次规则;
方式2:监控新作品增量,当增量达到 n 时,执行一次规则。
数据返回
每次请求的数据,都随机返回;
当分页数据被请求到末尾后,继续从数据头部开始返回,保持数据循环展示。
保证每位用户的每次信息流下拉操作,看到的都是随机数据,提高了曝光池中每一份作品的曝光几率。
如果有进一步精细化曝光的需求,则可以考虑对热度不同的作品分权重曝光,如在小红书信息流的示例图中,有8155点赞量的作品,也有30点赞量的作品。
方案2:历史热度排名规则
方案目的:根据热度展示内容与排名;
应用场景:热门类信息流。
热度排序
首先判断:点赞数高低,更高的靠前;
如果点赞数相等:判断收藏数,更高的靠前;
如果收藏数相等:判断转发数,更高的靠前;
如果转发数相等:判断评论数,更高的靠前;
如果评论数相等:判断发布时间,发布更早的靠前。
排序规则的判断指标、先后顺序,都可以根据实际业务调整。
数据过滤
对社区中所有作品按热度排序规则进行排序计算,且要排除已进入热门池的作品;
取出排名前 x 名的作品,放入热门池的子列表中;
子列表再放入父列表中,按照子列表的创建时间倒序排列;
如果当前计算中发现无可用作品,则本次计算直接跳过,等待下一次计算;
如果整个平台的可用作品数量 < x,则有多少就展示多少内容。
刷新机制
方式1:每 x 小时执行一次规则;
方式2:监控新作品增量,当增量达到 n 时,执行一次规则。
该方案在目前的移动互联网中,实际应用的场景已不多,但在少数web端的产品中如:虎嗅、36氪的信息流中,还能看到影子。
在目前的信息流展示策略中,最受认可的实属头条系的兴趣推荐算法,但对于普通企业来讲建设成本极高,有兴趣的朋友可以自行了解一下。
以上,抛砖引玉,欢迎指教,期待更多交流与学习。