这篇文章是《OTA推荐系统之实时用户意图》的姐妹篇,实时用户意图是基于短期的用户行为,找到用户的偏好,作为个性化推荐的策略之一,强调即时性。
OTA行业是一个低频的行业,对于老用户如何利用他的历史行为数据,建立更全面的用户体系,进一步提高个性化服务的准确率?对于新用户,因为没有短期用户行为数据也就没有实时用户意图了,该如何找到这些用户的特征,从而为这些用户提供个性化服务呢?本文将从WHAT和HOW(至于WHY就参考姐妹篇了)两个方面结合自己的经验给出建立用户体系的思路。
WHAT(是什么)?
本文的用户体系主要定义为:利用历史数据及外部数据,结合算法模型,为用户(新用户或者近期无行为的老用户)建立的用户特征图谱。针对新老用户举两个例子:
示例1:一个老用户在过去一年时间购买过一个带孩子去塞班岛的自由行产品,那么基于这样的订单行为,我们可以预测该用户下次出行的偏好特征包括:带小孩子,去海岛,偏好自由行产品。同时基于他的多次订单以及他的浏览历史,结合算法可以对预测的可信度进行修正,从而得到他的长期偏好。
示例2:一个上海的用户打开App,可以获取到这个用户的用户特征包括:用户当前位置上海,手机型号iPhone 7等特征。
用户体系主要是利用用户的行为数据,结合大数据技术来建立更加全面的用户画像,从而可以更好的为用户做个性化推荐服务。
HOW(怎么做)?
用户对自己感兴趣的内容会多次浏览或搜索,且用户的兴趣不会轻易发生改变
用户对和自己相似的人群喜欢的物品有同样的品味
如上午的两个示例所示,不同人群可利用的数据资源不一样,所以针对不同的人群所采用的思路,方法也是不同的。下面通过将人群分成两大类:老用户群和新用户群来给出它们的思路。
1. 老用户
老用户的定义:指的那些已经安装过App,并且进行过搜索,浏览等相关操作的用户,那些安装却在指定的时间段(一般是2年,不同的公司定义不一样)从来未打开过App的用户排除在外(对于这些用户群本文作为新用户处理)。老用户用户体系的建立同样依赖于用户的行为数据,包括他的浏览,搜索,收藏,购买等,相比实时用户意图,这里用到的用户的行为数据的时间纬度上更长(一般2年,不同的公司定义不一样)。
下面讲论述一下上图中的特征偏好的设计思路:
兴趣点的偏好
一个用户的旅游兴趣是可以基于他的行为来获取的,主要思路:利用算法从他所关注的城市集的景点特征预测出该用户的兴趣特征。举例来说:一个人在一定时间中曾经浏览过塞班岛,普吉岛,马尔代夫,三亚等目的地城市,并且下单去过普吉岛。基于用户访问城市集的所有景点,通过算法模型得到这些城市景点的公共特征为休闲,海岛,沙滩等,并且每个特征有置信权重,从而得到该用户的用户特征为:休闲,海岛,沙滩,并且每个兴趣特征有一个置信权重。
目的地的偏好
获取目的地偏好的主要思路:通过汇总他关注过的城市,排除已经去过的城市,从而得到用户有兴趣的目的地集。这里基于的假设是用户关注的目的地之所以没有去成是因为某种原因导致,那么这些目的地相比其它未关注的目的地对用户的吸引度度会更高,更容易被用户作为下次旅游的候选集。
产品的偏好
获取产品偏好的主要思路:通过汇总他关注过的产品(尤其是度假类的产品),排除归属于已经去过的城市的产品,从而汇总得到用户有兴趣的产品集。这里基于的假设同目的地的偏好中的假设,用户会对关注过的内容更感兴趣。
常去地的偏好
获取常去地偏好的主要思路:基于用户的订单产品,分析出用户在半年时间内购买过同一个目的地不同时间端的三个产品,从而得到该用户的常去目的地偏好。
建立了用户的这些特征偏好,在进行个性化推荐时就可以基于不同的业务场景需求来获取用户不同的策略来进行推荐,从而达到推荐的结果
2. 新用户
新用户的定义:指那些第一次安装App后使用的用户或者那些安装却在指定的时间段(一般是2年,不同的公司定义不一样)从来未打开过App的用户。建立这类用户的特征集有两种方法:利用外部数据;利用相似人群。
利用外部数据
公司为了拉新客或老客再营销,会进行站外的广告投放,目前计算广告的数据源包括下面三块:
第一方数据:为服务消费者(广告主,媒体方)自由数据
第二方数据:营销服务提供者所拥有的数据,如当百度作为服务提供者时,百度自己拥有的搜索数据。
第三方数据:为非直接合作的双方(例如:其他数据服务商)所拥有的数据
通过和站外的合作可以获取合作伙伴获取的用户特征集,结合这些特征集可以用来为新用户做合适的推荐。
相似人群
通过对已有用户特征的用户群按照地域,性别,年龄段等多维度来对人群进行分类,然后通过算法模型分析出不同类型人群的共同特征,得到千人千面的用户特征。当一个新用户访问App的时候,结合已知的用户特征(如当前位置,注册提供的信息等),通过算法模型找到匹配的人群,然后通过该人群的同样特征作为该新用户的用户特征。
综述
个性化推荐系统要建立用户和产品的特征,那么越全面的了解一个用户就越可以准确的预测出用户喜爱的物品。而更全面的了解一个用户依赖于可用的数据和算法模型的准确性,两篇文章给出了如何获取数据,获取怎样的数据,以及利用这些数据来建立用户画像的产品思路,希望能过给到大家以一点启发。
相关阅读
常见推荐策略及其在OTA上的应用
OTA推荐系统之实时用户意图