搜索和推荐,是电商平台里用户和商品信息交互的两种主要方式,也是电商平台内的两大自然流量入口。前者为用户主动触发,系统提供智能召回和排序;后者为用户在特定场景下,被动接收千人千面的个性化推荐的商品。
天猫作为国内顶级的B2C电商平台,产品打磨时间之久、用户量级之大有目共睹。本文第一部分依个人愚见,从场景解读天猫的智能搜索和个性化推荐,第二部分简要介绍搜索和推荐的中后台支撑。
PS:产品体验基于iOS版天猫客户端 V7.12.10
一、场景解读
(一)智能搜索
找商品是用户的基本诉求,搜索栏便是满足搜索诉求的载体:在搜索栏内输入关键字点击搜索、搜索列表页找到合适商品,点击进入详情页购买,这是一个简单直接的转化路径。
有几个业务问题需要考虑:
如何理解及预测用户找什么?
如何根据搜索关键词匹配正确商品?
庞大的搜索结果列表如何排序展示?
天猫的智能搜索解决方案如下:
1. 搜索详情页
(1)搜索栏内关键词智能预测
比如搜索关键词“彼得兔”,结果列表页未发生点击,每次返回首页时,搜索栏内均提供了预测关键词,依次是:彼得兔公仔、动物毛绒玩具、毛绒玩具小、兔子毛绒玩具、毛绒玩具、生日礼物女生等关键词。天猫在通过不断的修正关键词,预测、挖掘用户意图。
(2)最近搜索
可记录最近几条搜索关键词,点击可直接再次发起搜索行为,提高输入效率。
(3)猜你想找
搜索栏下还提供了猜你想找,提供了5条推荐关键词,其中有搜索关键字相关的个性化推荐,也有不相关的挖潜关键词,是搜索和推荐结合的产物。
(4)图片搜索
AR buy+、拍照识别,基于图像识别技术,识别图片场景中的主体,并搜索库中的商品。图片搜索非常适合于不能用语言准确描述主体,又能快速搜索到相关商品的场景。
(5)语音搜索
基于语音识别技术,将输入语音转化成文本,搜索相关商品。方便快捷的特性,使语音搜索已经成为搜索引擎的标配。
2. 搜索结果列表页
传统的搜索引擎是根据输入关键词,返回固定检索结果,而天猫会根据用户行为和画像,并结合卖家的流量投放诉求,实时调整搜索结果,以保证搜索结果的召回率、准确率,及个性化的排序。
召回率(Recall Rate)=检索到的相关商品 / 所有相关的商品总数,也叫查全率。召回率不足会导致明明有此商品却没有搜出来。
准确率(Precision Rate)=检索到的相关商品 / 所有检索到的商品总数。
排序会根据用户的历史行为、品牌偏好、价格偏好、商品销量、商品评论等,将最优结果排在前面,达到个性化的排序,以提高用户和商品的匹配效率。
(二)智能推荐
同搜索一样,推荐也是天猫重要的自然流量入口。推荐解决了用户在逛、找、比、等、凑、买等全链路购物场景下,用户与商品高效的个性化匹配。
天猫的智能化推荐解决方案如下:
1. 首页
首页是天猫的第一流量入口,承载着用户流量分发、用户兴趣探索等作用。
(1)轮播图
位于首页最显眼的位置,9张banner图自动切换,位置的优越性足以体现其带来的流量转化价值。
首页轮播图栏位一般是强人工运营的活动栏位,轮播图内容是针对所有用户的白名单。但是由于天猫用户的广泛性,消费能力各异、兴趣各异,因此活动的定向投放可以防止流量资源浪费,提高运营效率。
定向投放的规则基于用户历史行为、兴趣偏好、消费能力、促销敏感度等用户行为和用户画像,如男性用户看到的秋冬服装活动推广是“男士羽绒服”;浏览过某款橄榄油的用户看到“天猫食品频道买一送一”活动。海报上的橄榄油图片设计可能出自设计师,也可能出自AI设计平台“鹿班”。
总之,强人工运营规则加部分个性化介入的banner,使用户体验和流量价值最大化。
(2)限时抢购
提供性价比很高的商品,抢购活动倒计时暗示用户不要错过。提供的商品列表里有基于用户长期和近期兴趣的商品,也提供了热门爆款商品,主打性价比,“消费降级”模式。
(3)天猫好物
同样是基于用户历史行为,个性化推荐的商品列表。与其他栏位不同的是,此栏位的商品海报很大很精致,每页仅展示一个商品——图片同价格。
推荐业界公认的法则:推荐场景>UI>算法。鹿班千万级的白底图库提供的白底和素雅海报搭配显得很精致,让人联想起无印良品和网易的“严选”模式。
(4)聚划算
提供高性价比商品,但已经是阿里旗下另一大平台,有单独app。此处为聚划算引流,不再展开解读。
(5)发现品牌
是天猫第五层栏位。不同于其他栏位的商品纬度,发现品牌是以品牌纬度为切入点,完成品牌新品、资讯的推荐分发。
(6)限量潮流尖货品牌&个性化关注品牌
发现品牌顶层和底层分别是3个每日更新的限量潮流尖货品牌和4个随下拉刷新的个性化关注品牌,均是基于用户历史行为计算出的品牌偏好。
点开分别展示单品页和品牌详情页,前者的单品页以品牌某款新品为主,提供该单品的大幅海报及品牌其他新品推荐;后者品牌详情页提供了品牌简介、新品上市、限时特价、品牌资讯等内容,还提供了相似品牌推荐,如根据苏泊尔品牌推荐九阳、美的等品牌。
(7)天猫小黑盒
中层左侧是天猫小黑盒。天猫小黑盒定位于提供全球新品营销一站式解决方案。天猫官方会从世界各地搜索最近30天新鲜上市的全球新品提供给用户。天猫小黑盒结合热卖、热搜、好评等多重标准,提供基于个人兴趣的新品榜单,品类划分很细。
结合下方的“新品精选”、“最新上架”、“人气新品”,可最大程度解决基于商品的协同过滤算法遇到的商品冷启动问题,为新上市商品提供流量曝光和打造爆品的机会。
(8)品牌头条
中层右侧是品牌头条,实为粉丝福利社,首页主搜下同样有入口,提供品牌权益相关。
为什么品牌这个维度也会如此重要?
原因可能有很多。对用户来讲,用户喜欢高质量的商品,而品牌是高质量的保证,因此在点击、购买商品时会越来越重视品牌的选择,有强烈的品牌认同感;另外,用户还可能是某品牌代言人的忠实粉丝而对该品牌有特殊偏好。
(9)推荐榜单
推荐榜单提供了5个人气榜单和5个趋势榜单,均是细分品类,跟用户的兴趣强相关。榜单每日更新,根据销量、搜索量、好评等通过热榜算法计算得出,排序是非个性化的。推荐榜单给用户推荐关注细分类目下的热门商品,进一步丰富购物场景,促进用户点击并达成交易。
此外,还可在一定程度解决用户冷启动的问题。榜单是基于用户兴趣的,而不是统一的榜单,是因为:天猫品类繁多,不像图书类电商或音乐应用可以提供标准化的热销榜或Top10;天猫的用户体量已经足够大,现阶段可淡化用户冷启动问题,直接提供基于用户行为的细分类目榜单也未尝不可。
(10)猜你喜欢
作为最经典的推荐场景,猜你喜欢栏位位于首页末尾,第三屏即可划到,以瀑布流的方式展示近200条个性化推荐的商品。之前的版本,200条推荐结果是分类目展示,比如服装、电器、食品等,而且类目tab顺序还会个性化调整。最近版本去掉类目tab,直接切换为瀑布流的方式。个人感觉不如之前的好。
对用户,猜你喜欢的推荐场景可最大限度的满足用户无限刷屏、闲逛的场景。对平台,可以提供用户个性化体验,探索用户购物兴趣,刺激用户消费,促进交叉销售。
一般地,猜你喜欢栏位应用基于物品的协同过滤算法,输入用户搜索、浏览、加购等行为的商品,也可能会加上用户的年龄、消费能力、价格敏感度等标签元素,输出的直接是推荐结果,很难提供推荐理由。但前两条推荐结果有推荐理由。进入商品详情页不难发现,推荐理由其实是来自于商品评论中最高频的两个关键词。
此外,每条推荐结果都提供了“看相似”功能,可以针对当前推荐结果进行下钻,查看相似商品、相似品牌、相似榜单、相似搭配,进一步挖掘用户意图,引导用户达成交易。
推荐结果的点击行为可作为正反馈,曝光未点击、长按删除行为可作为负反馈,以此为依据持续对推荐模型进行调优,使推荐结果更加精准。
首页下拉刷新后会切换排序方式,可能是基于两种不同的排序算法,如点击率预估CTR/转化率预估CVR。
2. 商品详情页
(1)商品详情页
是用户完成加购、提交订单行为的重要页面。用户看完商品的图文详情,如果不感兴趣就会跳出该页面。因此,图文详情的最下方,适时地提供了“看了又看”和“精选好货”推荐栏位。
(2)看了又看
栏位的输入是当前浏览的商品ID,通过关联挖掘规则输出相关商品,仅展示当前品牌、当前店铺的商品,该场景的业务价值在于引导用户路径转化,防止用户流失,并提供其他相关商品,引导用户进入详情页完成交易。
(3)精选好货
栏位的输入是用户历史搜索、浏览、加购等行为的商品ID列表,通过关联挖掘规则提供的推荐商品列表。该栏位适用于闲逛过程中中断当前商品的购物链路,转向其他感兴趣的商品的场景。但探索用户的兴趣路径略深,个人感觉,如果改为推荐其他品牌或其他店铺的相关商品会更闭环、更合理一些。
对于天猫超市的商品详情页,推荐场景则有所不同。
商品详情页的首页下方直接展示推荐栏位,分别是猜你喜欢、看了又看、买了又买。考虑到天猫超市大部分都是快消品,精选SKU,用户的选择成本已经变得很低,比货、选货环节变弱,交易效率更高,因此推荐栏位从图文详情后面的较深位置直接提前到了首个tab第二屏位置。
看了又看
栏位根据浏览当前商品的人协同过滤计算出还看了哪些商品,品类与当前商品一致,提供的是相似商品列表,扩大用户的挑选范围。
买了又买
栏位运用购物篮关联挖掘,根据购买当前商品的人计算出还买了哪些商品,提供的是互补商品列表,深度挖掘用户购物意图,以达到交叉销售的目的。典型场景如某款婴幼儿奶粉,看了又看推荐的是其他品牌的奶粉,而买了又买推荐的是母婴人群关注的日常易耗品洗衣液。
看了又看和买了又买提供的是8条推荐结果,交互为左右滑动加载全部。个人感觉如果将每屏最后的结果只显示一半,暗示用户可左右滑动,交互会更合理。当然,是不是天猫的产品经理有意而为之就不好猜测了。
猜你喜欢
栏位更像是两种推荐策略的结合,即相似商品、互补商品的推荐结果合集。
3. 购物车页
购物车同样是非常重要的功能页,承载着收藏、提交订单等功能。购物车页内每个加购的商品左滑有“点击发现”,与删除功能并列,设计也是别有心意,起到一定引导作用。点击发现,则根据当前加购商品ID,推荐的相似商品、相似榜单、相似品牌,类似于上述推荐结果列表的“看相似”功能,下钻推荐,进一步帮助用户找到目标商品并达成交易。
加购的天猫超市商品有“去凑单”功能,根据天猫超市内加购的商品ID,获取关联推荐的商品列表,以价格纬度展示,完成用户的“满88元包邮”的个性化凑单场景。
加购的失效商品,推荐相似的商品列表,推荐策略类似于商品详情页的猜你喜欢。
最下方是猜你喜欢栏位,根据加购的所有商品列表,推荐相关商品,可以帮助用户完成货比三家的场景。
4. 支付完成页
商品支付完成,意味着完整的购物链路已经完成。支付完成后,下方依然有推荐商品栏位,没有名字,暂且叫猜你还想买栏位,推荐场景是根据用户购买及浏览足迹,继续推荐相关商品,引导用户点击并完成下一个购物链路,良性循环。
(三)总结
总体来说,天猫的推荐场景覆盖了首页、商品详情页、购物车页、支付成功页等主要购物链路的每个环节。
围绕电商领域几个核心KPI:CTR点击率、CVR转化率、GMV商品交易总额,天猫推荐系统通过复杂、适时的推荐算法和推荐策略,架起了海量用户和海量商品的桥梁,为用户千人千面的推荐个性化商品,其核心目标无外乎是:引导用户点击、引导用户转化、增加用户粘性。相信随着推荐场景及算法的不断迭代,推荐系统会为天猫提供更高的销售转化。
二、中后台支撑
早在2015年,阿里就提出了“大中台、小前台”的发展战略。其中中台将集合整个集团的数字运营能力、产品技术能力,对业务前台形成强力支撑。本文的下篇就简要介绍几个搜索和推荐相关的中后台。
(一)HA3搜索召回引擎
检索系统的流程如下:用户→匹配&推荐→预估模型→排序展示。匹配(match)和排序(rank)是两个重要环节,召回结果的质量主要决定了搜索结果的质量。
HA3是阿里巴巴搜索团队开发的搜索召回引擎平台,经过多年迭代,已经形成一套高效的在线数据存储和管理框架,离线产出索引,在线响应用query。
(二)在线机器学习系统
面对10亿级的商品,全库检索是不可能的,将10亿商品转化为30层的二叉树,机器学习层每层扫描,寻找最优,从而将10亿次衡量转换为30次从上到下的衡量。后面的预估模型对给定的商品做兴趣度的预估,点击率预估、转化率预估,通过预估后面有一些排序展示。
阿里搜索技术体系目前有offline、nearline、online三层体系,既能保证日常流量下稳定有效的搜索,也能满足双11场景下的短时高并发。通过批量日志下的offline离线建模,到nearline下针对增量数据的实时建模在线预测,然后到在线机器学习和决策。
传统的LTR(learning to rank)是根据历史的数据构造样本,回归出排序权重。这种方法解释了过去的现象,但未必是全局最优的。经常给用户反复展示历史行为的检索结果,缺少有效的探索能力。而通过在线强化学习(Reinforcement Learning,RL),可对商品排序进行实时调控优化。
强化学习的过程很像是条件反射。如果把搜索引擎看成智能体(Agent),用户看成环境(Environment)。Agent每一次排序策略的选择可以看成一次试错(Trial-and-Error),把用户的反馈,点击成交等作为从环境获得的奖赏。在这种反复不断地试错过程中,Agent将逐步学习到最大化累计奖赏,从而得到最优的排序策略。
(三)品牌个性化排序系统
前面文章提到过品牌的重要性,除了在首页的“发现品牌”栏位,搜索结果排序中,品牌因素也至关重要,将不同品牌的商品混杂在一起无疑增加了选择成本。
跟品牌强相关的特征即价格,因此将商品价格划分为7个区间,并结合8个电商指标:CTR点击率、CVR转化率、GMV商品成交总额、ATIP客单价、搜索次数、点击次数、加购次数、交易次数,形成56维向量。
用户行为类型特征也跟品牌强相关,购买的权重会大于浏览和加购的权重。然后基于此训练一个分类器。针对给定的用户id,使用分类器预测喜欢不同品牌的概率,基于概率对品牌排序。最终的搜索结果排序中,融入品牌的特征,满足了有品牌偏好用户的需求。
(四)电商知识图谱
阿里拥有全国最大的电商领域关系图谱,约几十亿实体、千亿边和几十种关系类型。其中包括:
用户社交圈:新浪微博关注、支付、淘宝天猫关注、通讯录、家人、好友等;
用户生活圈:家庭住址、工作地点、小区、城市、学校、商圈等;
用户标签:偏好类目、偏好品牌、偏好店铺等;
知识图谱将数据和知识高度结构化,可应用在搜索次归一、搜索推理联想、智能问答、智能审核商品发布等领域。
(五)ABFS统一特征服务平台
ABFS(AliBasic Feature Sever),统一特征服务平台,主要负责用户实时数据的处理及特征统计,如用户的基础行为特征(浏览、加购、收藏、购买)、统计特征(点击次数、转化率)。用户的实时数据在ABFS上,传递到TPP平台供BE调用。
(六)TPP推荐平台
TPP(ThePersonalization Platform)平台,也称阿里推荐平台,承接了阿里集团300+重要的个性化推荐场景,包括首页猜你喜欢、购物链路等。TPP平台集成了RTP、iGragh、BE等常用服务,方便数据的流动调用,降低开发成本,帮助业务和算法快速上线迭代。
(七)BE向量化召回引擎
BE(BasicEngine),向量化召回引擎,是DII中的推荐召回引擎,负责从多种类型的索引表中召回商品,并对候选商品集合进行过滤和粗排序。线上召回效率极高,可以在几毫秒内对全库商品进行召回。
(八)RTP实时打分预测引擎
RTP(RealTime Prediction),实时打分预测引擎,收到TPP推荐系统的前端请求后,RTP平台实时产出特征,运行CTR、CVR等各种预估模型,并对请求列表中的每个商品计算分值,得出精排序结果列表。
(九)iGragh图查询引擎
超大规模分布式在线图存储和检索。数据流程中的用户特征、用户偏好类目、热门商品召回等信息,不需要频繁更新,存到iGragh上方便存储和调用。
(十一)Porsche在线学习平台
Porsche是基于Blink的分布式流式计算框架,提供了日志处理、特征计算和实时建模的插件接口。算法人员通过在Porsche平台上离线调试模型,调到最优结果再发布到线上。如:用户商品复购率模型、用户商品喜好归因分析模型等。
(十二)鹿班智能设计平台
鹿班(AI Graphics) 智能设计平台,包括智能生成、创作助手、智能排版、设计拓展等功能模块,可帮助企业快速、批量、自动化的进行图片设计。
一键生成:将商品相关素材、文字输入,选择自己需要的海报尺寸、风格等,可自动生成符合要求的海报作品。
智能排版:将拍摄好的照片和需要的文字输入,选择尺寸,可自动生成带有随机风格的海报作品或产品展示。
设计拓展:将设计完成稿输入,选择需要拓展的尺寸,可自动生成相应拓展尺寸的结果。
智能创作:拥有自己独特风格的设计师将自己创作好的系列作品输入,可以训练机器,并成为系统新的效果风格。
2017年双11,鲁班总共设计了4亿张海报,平均每秒设计8000张,每天完成4000万张海报制作。截至目前,鲁班已经累计设计了10亿次海报,极大节省了海报设计成本。