快好知 kuaihz

【探索篇】2015年新淘宝搜索人气排名算法提前解析

大家也挺忙的,我们快速进入主题:

为了大家看起来方便我这边把URL里面其他一些干扰的参数全部去掉了,如果亲们想了解其他干扰参数的意思可以单独评论里面提出来,这边就不多说了。

http://s.taobao.com/search?q=diy相册&sort=newsale-desc

如图所示:

大家看到这个sort参数采用了 newsale-desc

那么我们就会想到有newsale就会有原来的sale(按销量排名)

如图所示:

按人气排序:sort=renqi-desc (PS:看来这程序英文也不咋地,看着简单就秀下英文,复杂就直接拼音了)

如图所示:

按信用排序就是 credit-desc 这个没啥用

本来看到这个觉的挺新奇的,做为人气值其实很多关注搜索的人都在猜测和研究它的一个值,现在淘宝开始慢慢透露。

做为一个多年研究搜索的人,一直都是以一种结果论,用一种模糊的概念来猜测这个值。我们经常会遇到这样的问题,为什么我销量比他高排名没他靠前?为什么销量一样我单价比他高排名没他靠前?为什么淘宝经常说低价的排名不会太高,怎么还会有这么多9.9排名这么高...这时我们就搬出那一套影响人气模型排名几个因素,告诉他你这个没他好,那个没他好(试问这样的理由能让他满意吗?如果他的排名比别人高,你可能又会说你这个他比好,那个比他好)

其他我们心里都清楚淘宝是有一个值来评定宝贝的人气高低,现在这个淘宝公布的人气值完整的解释了每一个宝贝的人气值具体是多少(不需要我们来猜测),严格按照人气值的大小来排序。当然流量最大的综合入口还会夹杂着上下架时间丶店铺权重丶个性化千人千面等。

那么问题来了,这个值的增长具体跟那些因素有关呢,我想这几个因子是不会变的,无非跟宝贝的销量丶单价丶收藏丶购物车丶搜索转化率丶宝贝转化率丶DSR丶搜索点击率丶店铺权重等因素有关。

在这么多变量的情况下我们如何得出每一个因子的影响力呢。(这个是值得探讨的问题)

我这边大概描述下我这几天的思考,我们先姑且拿出几个影响最大的因素:

购买人数:A 影响因子:a

宝贝成交金额:B 影响因子:b(从平台角度还是会优先考虑单个宝贝的成交也就是单品GMV贡献)

搜索人数:C 影响因子:c

加购物车人数:D 影响因子:d

宝贝转化率-行业平均转化率: E 影响因子:e

宝贝搜索转化率-宝贝平均行业搜索转化率 F 影响因子:f

搜索点击率-行业平均搜索点击率:G影响因子:g

其他DSR 店铺权重等等因素在短时间内变化不大的因素我们把它看成一个常量 A

aA+bB+cC+dD+eE+fF+gG+A = 人气值

这个不是标准公式,只是能够用来给我们提供经验的一个经验公式,这样我们发现7个变量,我们只需要采集7天的数据,代进去出来7个等式,既可以得到每一个变量的大概值,这个值越大我们需要花的精力就越多,而且能够得出多几倍这样的具体数值。这个会让我们非常兴奋。

为此我用采集工具写了几个脚本,比较简单,会采集的亲们有了我上面提到的URL地址应该也会自行采集人气值以及自己店铺宝贝后台的数据。(目前还只简单的写了采集脚本,限于本人不是做软件开发的,所以还没发开发出软件供大家使用,如果大家真的觉的非常有用,我也会联系逐鹿或者老A开发一个,或者让这个功能加入他的工具箱中)

贴几张图大家看看

这个是5月26号的数据:

如图

这个是5月27号的数据

如图:

——————————————分割线——————————————

小插曲:在做采集数据的时候额外的发现几个细节跟大家分享下。

1丶淘宝在提供的这个人气绝对值不随关键词变化而变化,所以你的宝贝人气绝对值很高,你只需要通过文本模型(标题)的筛选就能有不错的排名。

2丶在人气属性的后面紧接着出现了一个 comment-count,猜测应该是有效评论数或者评论数的实际值。为什么这么说?因为我在比对各个宝贝的时候发现详情页里面显示的评论数和源码中读取的数据不一致,上几张图吧。

从天猫搜索里面查阅到发现和这个数据是一致。

3丶其他还发现一些DSR分数的信息,店铺的信用信息。

一中午时间码了这些字,还挺累的,边想边码,难免有出错的地方还请见谅。

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:淘宝  淘宝词条  算法  算法词条  解析  解析词条  探索  探索词条  提前  提前词条  
电商

 如何在网上开店创业【完整版】

网络时代,让很多怀有创业梦想的人士距离梦想更近了。  网络店铺、网上创业成为这个时代的热门话题,无数的年轻人跃跃欲试,渴望以体验创业的激情。  的确,网络给现代...(展开)