抖音是现在的一大流量平台,在这里有人靠一个短视频就火了,但是也有人始终没有火起来。那么,抖音的推荐策略究竟是怎么运行的,真的一切都是玄学吗?
想象一下,站在推荐系统之城前的你被抽离出一个数字的躯体。你找到一面镜子端详自己,却惊诧地发现自己的身体已被无数数据所组合:科技10%、篮球4%、历史1%、自然0.3%……
——闫泽华《内容算法》
如果你是个专注于抖音的创作者,如果你依然认为抖音是个“玄学”APP,如果你无法在抖音获取到稳定的流量,下面的内容请仔细阅读,因为它可能会颠覆你的认知。
从抖音的核心分发逻辑说起
什么是“分发”?
创作者生产的内容,如果想被其他人看到,就需要把内容放到用户能看到的地方,比如转发到他们的聊天框或者朋友圈,或者推送后等着粉丝自己点进来看。
在博客或者公众号时代,你的内容想要获得更多曝光的方法只有一个,那就是获得足够多或者足够优质的粉丝,并鼓励他们转发出去。一个零起步的公众号/博客,获取曝光的唯一办法就是作者自己发布到朋友圈,或者群发分享给好友/群。
这非常不效率,因为创作者的主动权很小。
如果平台能够帮忙把你的内容放在很显眼的位置(比如网站的首页),或者帮你把你内容发布到每一个用户的面前,那内容的曝光量就非常可观了。
——抖音就是这样帮你分发的。
但是,抖音并不会把每一个创作者生产的内容都分发到抖音的用户面前,这非常不现实。一个是因为内容创作者太多了,即便把内容推荐给用户,用户也没时间看完;另一个是,不同的用户有不同的喜好,如果把一篇足球相关的内容推荐给一个喜欢化妆的女孩面前,这对于女孩来说非常不好。
这就需要抖音用一种策略来优化它的分发方式,好让好的内容被更多的人看到,也好让用户只看到自己喜欢的内容。
抖音的采用的优化方法叫做“算法分发”,并且是以一种叫做“协同过滤”为主的分发方法。
这个词非常晦涩,你不需要记住它,只要知道它的原理就好了。用两个简单的词来形容的话,就是“物以类聚,人以群分”。两个词分别对应两种方法:基于物体的协同过滤和基于用户的协同过滤。
什么是“基于物体的协同过滤”?
假设A1、A2和A3是同一类内容(比如都是NBA相关的),当某个用户喜欢了A1这条视频,那么理论上他也会喜欢A2和A3。反过来,如果用户看到A1和A2这两条视频后没有点赞(喜欢),那么也不应该再把A3推荐给他。
在这种推荐算法下,当系统想要给用户推荐内容的时候,需要两个步骤:
对于抖音来说,这种方法有以下几个麻烦:
每天产生的视频太多了,抖音要对每条内容做识别分类;
视频内容识别太麻烦了,除了需要识别视频画面中出现的物品以及他们之间的关系外,还要识别视频的背景音乐、台词。
显然,对于以视频为主要内容的抖音来说,选择这种推荐算法是极其不明智的。不过,好在还有第二种算法。
什么是“基于用户的协同过滤”?
假设A1、A2和A3是同一类人,他们有相同的喜好。如果A1和A2点赞(喜欢)了某条视频,理论上A3也会喜欢它。反过来,如果A1和A2看到某条视频后没有点赞(喜欢),那也不应该把这条内容推荐给A3。
在这种推荐算法下,当系统想要给某个用户推荐内容的时候,需要两个步骤:
找到跟这个用户相似的目标群体;
你会发现在这里种推荐算法里面,压根就没有内容什么事。算法不必知道某条内容是什么,只需要看到某一群人都喜欢这条内容就可以把这群人归到同一类人里。
所以,在这种推荐算法里,当我们以上帝视角去观看抖音里的用户时,其中的一个维度应该是这样的:
喜欢了相同内容的用户被打上相同的标签,当某条视频被该类人群中的部分人喜欢后,系统会把这条内容推荐给具有该标签的其他用户。
在这个逻辑下,螺旋推荐、养号、再发一遍就会火等“玄学”说法就都找到原因了。
这只是开始,下面我要基于上面的基础知识,尝试颠覆你的固有认知了:“你是谁”比“你拍了什么”更重要。
你被困扰的以下玄学疑问,可以被同步解决:
为什么要养号?
再发一遍为什么会火?
为什么我的视频都是500播放?
为什么抖音账号定位比任何时候都重要?
为什么剧情类内容火?
抖音怎么做?
“内容为王”是最近几年创作者已经达成的共识,生产一条让用户能看懂、愿意分享的内容是每一个创作者苦苦追寻的。因为你发布的内容是直接跟用户“对话”的,只有用户看懂了、愿意分享了,你的内容才能被更多的人看到,用户是整个内容传播过程中非常核心的因素。
而在抖音,你对话的对象不再是用户,而是“算法”。你要先让算法理解你的内容(其实是你),才能把你的内容分发到正确的用户面前。
如果你的内容没有被算法识别,那么即便你笃定内容非常优质,它依然没有机会跟用户见面,或者出现“一条非常优质的机械键盘测评视频,被推荐给亟需买支口红的女孩子”的尴尬场面。
我们简单梳理一下一条视频被发布后所经历的流程:
这个流程中最核心的一步,就是“算法识别”。
算法会识别你发布的视频内容包含什么标签、被带有什么标签的用户喜欢么?
这显然是低效的。
我们试着换个角度来思考这个问题,一切就拨云见日了:
用户发布的视频是不是可以代表这个用户的喜好?算法把A1用户发布的视频推荐给具有相同喜好的A2、A3用户会不会得到他们的喜欢?
答案是肯定的,并且这种方法比识别视频内容的方法高效得多。
“你是谁”比“你发了什么“更重要
于是,“养号”这个问题的疑问解决了:把账号的喜好明确的表达给算法,好让他能准确地把你发布的内容分发到正确的人群里。
但这里面有一个问题:A1用户只有一个喜好么?
显然不是。
如果你前面读得仔细,应该可以看到“抖音用户的聚类”那张图片前面我用了“其中一个维度”来描述。实际上,因为每个用户会有多种喜好,所以抖音的用户聚类应该是个多维空间,也就是说,在这个维度下,A1和A2、A3在一起;但在另一个维度下,A1是和a2和a3聚合在一起的。
多维聚类示意图
基于此,“再发一遍就会火”这个玄学问题也得到了解答:相同的内容第二遍发布时,算法把它推荐到你正确的那个标签下。
举例来讲会更容易理解:
你有两个喜好标签,分别是篮球和汽车。你拍了一条关于汽车的视频,系统第一次推荐时把视频推荐给了你篮球喜好那个群体,所以视频止步500播放。第二次发布时,算法选择了汽车那个标签,于是火了。
那么这里你一定会有问题:第一次推荐没有火以后,抖音为什么不试着把视频推荐给另一个喜好的人群?
没有得到足够的“喜欢”,这个结果对于系统来说无非两个原因:
你的视频不够优质,连可能喜欢的人都不会喜欢;
视频被推荐给了错误的目标用户。
作为创作者的你一定希望当没有得到足够喜欢的时候,系统会选择第二个原因,然后把你的内容推荐给另外500人看看他们会不会喜欢;但同时作为抖音用户的你,当你每天被抖音的算法“试错”刷到很多自己不喜欢的内容时,你一定很烦躁。
为了保证用户体验,系统只能认为获赞不够多的原因是“你的内容不够优质”,于是曝光止步500不再增加。
所以,作为专业的内容创作者,我们显然不能靠“第二遍能火”这样极具不确定性的方法来获取流量。
账号定位要有明确边界
于是你应该可以想到,想要获得稳定的系统推荐,你账号的喜好应该越少越好,甚至最好只有一个!
所以,账号的定位比任何时候都重要,如果你在最开始“养号”的时候,给了账号一个不那么清晰的定位,就会导致账号有不那么明确的喜好,于是算法也不能给你明确的推荐。
正确的抖音账号定位是“账号具有边界清晰、尽量单一的喜好”。
从社会学角度,我们相信再“偏僻”的喜好也会有一大群人;但是从内容生产成本角度,你应该选择一个可以快速被定义出来的人群标签。
如何判断某个人群标签是否清晰?
举个例子,我曾经想在抖音运营一个生产“互联网黑科技”相关内容的账号。在我养号的时候发现,这个定位一直在“程序员教编程”、“马云雷军”和“黑科技3C发明”之间游离,无法精准定位出边界。
于是放弃,改做口红试色。
说了这么多,但还不能清晰定位自己的账号怎么办?我推荐你去做“剧情类”账号。
当你不能定位出一个边界清晰、喜好单一的账号,那么你可以去它的反面,那就是所有人都会喜欢,不分边界的内容:剧情/幽默/情感/正能量……
所以,你知道为什么这类内容会火了吧?