机器深度学习逐渐成为互联网的焦点。信息大爆炸的时代,如何将碎片化阅读与机器学习完美结合,实现个性化内容信息的分发?本文将以另一种视角解读分析“聚合类信息平台的巨头”——今日头条。
一、今日头条的产品简介
1. 产品定位与介绍
今日头条是互联网连续创业者张一鸣于2012年3月份创建,一款基于数据挖掘的推荐引擎产品,为用户推荐有价值的、个性化的信息,提供连接人与信息的新型服务。
产品slogan:你关心的才是头条
产品定位:聚合类资讯app
2. 市场分析
于2012年8月发布第一个版本,截止2016年8月底,今日头条目前拥有超过5.5亿的装机用户,月活跃用户超过1.3亿,日活用户超过6000万,每个用户平均每日使用时长超过76分钟,人均单日启动次数远超其同类竞品。
随着移动互联网人口的红利消失,网民人数已经区域饱和的趋势下,产品越来越重视用户的使用时长数据。用户使用时长移动应用排名中,今日头条已经排到11位,紧随手机淘宝之后(top20中腾讯占了7成,第一和第二分别位微信和QQ)。
3. 今日头条——张一鸣
每一款产品的发展都会或多或少都会收到创始人的影响,我们通过了解其创始人的背景,希望能对产品有更深入的了解。
张一鸣,今日头条创始人,现任CEO。
2005年,南开大学毕业加入酷讯。加入酷讯之前曾有过短暂的时光和师兄创业。
加入酷讯后,两年的时间从一枚普通的程序员进阶为技术开发总监(这段经历张一鸣在篇文章“最看好年轻人的五个特质”中有详细描述,感兴趣的同学可以看看)。
2008年,加入微软同年离开并以技术合伙人的身份加入社交网络校内网和饭否。
饭否关闭后创立了中文房产搜索网站九九房,九九房当时已成为第三大房产信息网站,并在移动领域同类应用中遥遥领先。
2012建立了字节跳动科技有限公司即今日头条。
总结起来,就是不断的创业,不断的颠覆自己,去做自己想做的事情。他创建今日头条之前的一次创业已经成功。因为在饭否和王兴(美团CEO)一起创业,所以不断的有媒体把他们两个一起比较。
相传张一鸣在坐地铁的时候用报纸读新闻,而周围的人都用手机看新闻,意识到移动互联网的到来,我们处在信息大爆炸的时代,获得自己想要的信息,成本却是越来越高。以此创建了今日头条。
二、今日头条的产品分析
如何成长为聚合类APP中的一匹黑马?
如何将“个性化”阅读做成行业竞相模仿的标杆?
如何实现用户与内容的精准连接?
头条拿到用户的行为数据后,会对用户做个简单的模型分析,建立标签树对内容主题等提取分类,按照用户的标签推荐给用户,实现个性化推荐。
个性化推荐的三要素:用户,模型,内容。
1.界面分析
主流的图片+文字形式展示信息,提升碎片化阅读的舒适感;
本地缓存,网络状态不好的情况下不用加载,同时在网络状态不好的情况下,显示小图,提升加载速度;
已经点击阅读过的文章置为暗色,两次间隔过久,自动记录上次浏览的位置,帮助用户;
下拉即可刷新获取更多文章;
提供短视频的入口,提供不同的信息浏览方式;
突显评论,分享的地位,提升用户的参与感。
今日头条放弃直播,将短视频放到第二个入口,个人认为是因为短视频内容更适合控制和做分发。此外直播对网络环境的要求较高,因此短视频更有优势。
如何拿到用户更多的行为数据?
在客户端拿到更多的用户行为数据,才能给用户建立更完善的标签,推送的内容才能更准确,那么今日头条对用户行为数据的采集做了哪些努力?
(1)引导用户登录
只有完整的账号体系,才能给用户建立系统的模型,新闻客户端的产品特性决定,用户在不登录的状况下也能正常使用,今日头条在引导用户登录做了很多文案方面的刻意引导。
用户点击小叉后,提示文案:减少类似内容,登录后推荐跟精准;
用户第二次打开客户端,我的文案明确提示为“未登录”状态;
第三方,微信,QQ快捷登录。登录页提示文案:登录后保存阅读习惯,打造专属头条;
头条不乏使用一些大尺度的图片来吸引用户,引导用户持续使用并登录。
(2)获取用户对推荐问文章的正负反馈,建立完整的模型提示
今日头条的界面有个很明显的特征,每篇文章右下角有个小叉号,用户点击可选择理由,屏蔽相关文章;
短视频界面,用户点击右下方,选择不感兴趣,可屏蔽相关视频类的推荐;
通过以上两种来获取给用户推荐精准与否的负反馈,优化自己的推荐算法。
同时头条将分享,评论,收藏,关注文章作者的头条号功能摆放的比较凸显,甚至在某些文章的下面增加打赏的功能。今日头条不只局限于新闻资讯APP,不断的拓展自己的边界,打造成一个推荐给用户喜欢的所有内容的平台,引导用户自主的转发,评论,收藏,关注获取用户的更多的行为数据,来判断用户对推荐文章的喜好。
(3)频道推送,头条号,社交因素
在首屏,频道类根据热门频道,和用户自己主动添加的频道给用户推荐,当然根据频道推荐在传统的新闻客户端的比较重要,今日头条的推荐算法中的占比并不大,让用户主动选择是有成本的,同时有些文章很难按照固定的标签划分。
头条开创头条号后,在文章和短视频中,开始主推自己的头条号,同时在关注中有各种类型的头条号可供用户选择。根据用户关注的作者的头条号,为用户推荐类似的内容,拓展用户的阅读范围。
头条也在不断的尝试社交,来增加用户的粘性,获取更多的用户社交数据,例如同步通讯录好友,关注明星等大V的头条号(有点类似于微博的味道)。同时头条也在开创头条问答的社区,在社区社交方面,可以看到头条也在做不断的努力和尝试。
2.个性化推荐模型分析— 如何做到个性化推荐,实现内容与用户的精准连接
(1)新用户—冷启动
新用户登录之后,并没有任何行为数据,如何给新用户做个性化推荐?
当新用户加入时,一般需要给用户一个初始兴趣值今日头条选择了冷启动的解决方案——通过对用户微博账号的分析建立一个“兴趣图谱”,即根据用户在微博上发布的内容及其所属类别、用户自标签、社交关系、社交行为、参与的群组、机型、使用时间等来数据源来推断出用户的兴趣点有哪些。社交关系、社交行为即用户和用户之间的交流状况,可以根据二者间的共同好友数、相互评论熟、@数等来做度量。
(2)根据用户的行为数据,完善模型
通过用户对推荐的文章,视频。评论,分享,收藏,点赞,屏蔽来获取用户的正负反馈数据,不断完善用户的模型,画像。
(3)协同过滤
基于用户的写通过率推荐算法先使用统计技术寻找与目标用户有相同喜好的邻居,然后根据目标用户的邻居的喜好的文章,向目标用户推荐。基本原理就是利用用户行为的相似性来互相推荐用户可能感兴趣的文章。
(4)环境特征
根据时间,地理环境特征为用户推荐不同的文章。例如用户早上和晚上想读的文章肯定不一样,在办公室和家里想读的文章也有区别,用户的地理环境特征比较难获取,这也是头条个性化推荐的一个短板。
内容的分发—哪些内容适合推荐给用户
创作者产出一篇文章,会经过层层筛选,然后推荐给需要的用户
(1)机器去重。
(2)文章主题分类。
使用自然语言处理和图像识别技术对每条信息提取几十个到几百个高维特征,并进行降维、相似计算、聚类等计算去除重复信息;对信息进行机器分类、摘要抽取,LDA主题分析、信息质量识别等处理。
(3)热门文章与新文章的平衡
给用户推荐新文章还是热门文章,两者之间要做一个评估,既让用户能看到热门文章,同时让新的文章也要有机会接触到用户。
3.内容的来源
今日头条有别于传统的新闻客户端,并没有自己的编辑部门,前期的内容都是靠爬虫抓取,当然在今日头条创建初期的时候,这样会给传统的新闻客户端带来一部分的流量,也不至于形成直接的竞争,这些传统的新闻客户端也乐见其成。后期头条逐渐做大,带来的更多的版权问题。在内容创业盛行的大趋势下,今日头条推出头条号,投入2亿基金大力扶持平台原创内容,弥补内容质量短板,打造互联网创作的第一平台。同时抓住短视频内容创作的风口,投入10亿大力发展。
三、总结
分析完头条的产品模式,我们再来总结下头条为什么能获得今天的成功。
1.技术的优势和清晰的产品定位
今日头条在推出之前,张一鸣团队就推出过头条段子等一系列的产品来验证用机器学习做内容信息分发的可行性,之后推出今日头条并迅速获得成功。
头条不同于传统的新闻客户端,是款聚合类信息的APP,连接的人与信息,这有点类似于百度,依赖流量变现。
2.头条APP不断的尝试获取用户更多的数据,通过机器学习不断扩容大数据库构建自己的壁垒
头条在产品界面,如何获取用户的行为数据,正负反馈。做了很多尝试,并通过机器学习不断的完善自己的大数据库,优化模型分析,建立起自己的技术壁垒。
3.开始发力弥补自己内容原创质量不足的短板,头条号已经取得不错的效果
说起头条不得不说的的一个就是头条号,头条号自创建以来,已经取得不错的成绩,弥补自己的原创内容不足的同时,也为自己重新建立了一道护城河。
四、个人建议
1.文章,视频的内容质量有待提高。
头条推荐给用户的东西仍然给人低俗的形象,这也影响着头条的发展。标题党,大尺度的图片等成为用户不断吐槽的点,大尺度照片是头条自己内容质量的短板的问题,是用户自己选择的结果。也同时不排除头条刻意推荐给用户这些图片,提高用户的使用时长,毕竟流量才是头条的目前变现的方式。
2.个性化推荐并不是很精准(增强用户环境特征的挖掘,允许用户自贴标签)。
3.作为新闻资讯类的产品,新闻时效性比较差(头版区域设置新闻专栏,增强热点新闻的推送)。
4.在社交上可以做更多的尝试,比如建立兴趣小组等。
以上内容纯属个人兴趣整理,个人拙见,有看法相左的,欢迎随时讨论。