在去年即 2019 年 4 月 22 日,在码农圈发生了一件大事。
一个名为“openbilibili”的用户在全球最大的“同性交友平台”Github上创建了一个“go-common”代码库,某站网站后台工程源码被恶意开源。
官方确认
源码一向是互联网公司的核心资产、核心竞争力,相当于上帝的创世手册。
这么一个东西的流出,对某站而言肯定是一个巨大的事故,但对其他主体(如竞争对手、圈内码农、UP主、创业者)而言更多的是心照不宣的狂欢……
深的不提,单单里面涉及的推荐和加权算法就足够让人意乱情迷,因为里面蕴藏的是引爆算法推荐流量引擎的核心密码。
上面的代码什么意思呢?
核心是某站视频和专栏两部分内容的推荐算法,例如视频涉及“ 硬币、收藏、弹幕、评论、播放量、点赞数、分享数、更新时间”这几个因素,每个因素被赋予了不同的权重,通过图中的公式每一个视频都会有一个最终的权重分数,然后算法会根据权重分数大小对内容分配量级不一的分发曝光。
其中实效和分享所占权重最高,因此要想在小破站获得算法机器的垂青,就得鼓动用户多多三连分享,其次把握时间窗口,确保时效性(肚子里墨水有限的,可以翻新内容隔三差五重复发。。。)
注意:每个平台属性不同策略会有出入,不同时期的平台策略也会有所不同。
某站的例子只是个引子。
咱再接着深入解剖,回归算法的根本。
周知,算法核心目的是将用户感兴趣的内容推送给相匹配的用户,提高用户获取信息效率,留住用户为变现提供充裕操作空间。
那什么是用户感兴趣的内容呢?用户对内容的感兴趣程度通过什么去衡量呢?
1,打开率,每一个新内容算法都会给一个流量池去给内容露出,打开率直观地会表现为阅读量,播放量。 当用户点击内容,就会产生一个打开率。
2,完播率(完读率),包括变体停留时间,打开不意味喜欢,也有可能被标题党骗炮,也有可能是刷的数据,因此单单参考打开率是不够的,如果用户能够把内容从头到位看完那大概率是真爱了,于是从点开那一刹那到看完就能折算出的完播率更有价值。
3,分享率、转发率,不管是对平台还是对创作者还是用户自己本身,分享转发扩散“优质”内容绝对是 3 赢的事,分享率是判定内容优质程度的深度黄金指标之一。
4,收藏率,作用跟分享差不多,人都有私心,很多特别好的东西囿于各种因素未必会公开分享,很多人倾向于悄悄自己藏起来。这个指标自然也是判定内容优质程度的深度黄金指标之一。
5,点赞率,有些平台点赞兼具分享功能,例如知乎,抖音。 也有的平台,点赞就是点赞,适用于想表达对内容对创作者的欣赏但又不便转发的情形。同样是判定内容优质程度的深度黄金指标之一。
6,评论率,包括弹幕等变体形式,评论绝对是深层次的互动形式,要知道在移动互联网时代,用户早就娇贵得了不得了,点开就难能可贵,留言那绝对对内容是强烈的情感表达。
从某种程度,在程序眼里,能让用户产生情绪波动的内容就是好内容,至于程序怎么知道用户情绪波动没波动,评论绝对是最直观的一个指标。后续随着算法AI迭代,连评论区的留言语义都进行分析,算法的洞察力会更加变态。
7,赞赏率,包括送小礼物,投币等变相形式,由于付费覆盖内容较少,因此是否参与权重排名,得具体平台具体分析。
8,更新时间,这一点很容易被大多数人忽视,目前所有平台目前都格外重视内容的实效性,经常会给新内容提权。不过时间加权药效过得快。
推荐算法也许会有很多不同的策略形式,但万变不离其宗,再怎么变都是在这些基础要素上做文章,互动越激烈总是能得到推荐算法的青睐。
每个平台会根据自己的产品特性,对各个指标进行赋权,进而每一个内容都能得到一个加权分数,接着就能按照分数高地决定内容在多大的用户群体面前曝光了。
实际应用中,很多平台都是一个流量池接一个流量池爆,不会让内容一次性在全平台曝光。
经过一道道筛选,大热的内容肯定切合绝大多数用户的喜好,因为算法接收到了强烈的用户与内容的互动信号。
解析完上面的原理,那么如何引爆流量引擎就非常明了了。
那就是——不惜一切代价激发用户互动,无互动不内容。
凡是不能让用户动起来的内容,在智能算法推荐时代,那就是垃圾,不管你自以为有多优秀,没有曝光,什么都不是。
单单有内容是远远不够的,互动率也成了流量的基石。
也就是说一个内容必须植入引发用户互动的基因,否则就是浪费表情的废品内容。
如何引爆内容互动率呢?这又是另外一个问题了。