搜索系统作为用户自行使用的引导工具,重要程度不言而喻;本文主要从4步:需求识别、检索、排序、展现来总结搜索系统的工作机制。
搜索是一个比较有年份的功能,他不是一个简单的搜索框,毕竟搜索造就了一个百度帝国。
搜索系统在产品架构中是帮助用户搜索到他们想要的内容,当用户不知道如何通过其他路径直接获取特定内容的时候才会使用,也就是说搜索是用户自行使用最后的一个引导工具,重要程度不言而喻。
首先对搜索建立一个整体大概的认知,搜索工作机制如上图,主要分为4步:需求识别、检索、排序、展现。
一、需求识别
用户在搜索框中输入的关键词即用户想要查询的内容,首先需要机器去识别出用户想要的是什么,才能把用户想要的东西递给用户,首先介入工作就是分词系统,通过对关键词的整分词匹配或通过语义解析尽可能的了解当前用户的需求。
检索:了解用户想要什么东西了后,就去仓库里面把不同区存在的货物提取出来,准备交付。
排序:为了卖出更多的货物,会对自己的仓库定一系列的规则,如:近期要卖的优先、信誉好的供应商优先等进行排序,保证给到用户我们最好的货物。
展现:知道用户想要什么、也从仓库提取了后,按照排序规则展现给用户就可以了。
接下来落实到具体的产品方案,坚持一个底层原则:从业务中来,到业务中去。
明确本次搜素策略优化目标,围绕目标高举高打:
如:能够准确识别用户query背后对商品的需求,并根据排序规则在页面反馈结果集。
关键衡量指标:
商品需求识别准确率:已识别出的query中真正带有商品需求的query占比,越高越好;
商品需求识别召回率:已识别query中真正带有商品需求数量的query在所有带有商品需求query中占比,越高越好。
检验策略效果计算方式:
正确率 = 提取出的正确信息条数 / 提取出的信息条数
召回率 = 提取出的正确信息条数 / 样本中的信息条数
想要更好的优化方案,可以对现有的搜索关键词和模块数据进行分析,从某交易产品月上万个搜索关键词中,随机抽取了1000条搜索关键词字数分布如下图:
通过对用户输入的关键词进行分析,结论:
用户输入关键词数量:2、3、4占据总字数的80%,所以:我们需要做一个搜索联想提升用户搜索效率。
用户关键词主要分布在:品牌、商品名、品类名、其他特殊字词等,所以:我们要根据各种场景细化出不同的排序方案。
用户有较多次出现搜索为空的情况,引起这种结果有两种可能:① 搜索现有的准确率较低。 ② 现在平台商品SKU 较少。
该部分需要考虑到用户在使用搜索时有什么使用场景,在不同场景下有怎样的行为反应:
三、排序计算方式
排序是整个搜素平台最为关键的一环,此处需要权衡商家、用户、平台的综合利益考虑,如商品搜索可以将特征维度分为:商品维度、卖家维度、平台维度、个性化、反作弊等维度,通过落地到自身业务的当前状态,可得出关键参考点有:
商品名称:商品的全称匹配率。
副标题:副标题与关键词的匹配率。
销量:商品销售数据权重较高。
标签:有标签的商品比没有标签的商品权重更高,标签排名:促销(满减、N元任选)>秒杀>包邮 >其他。
权重参考值排序:商品名称 > 副标题 > 销量 > 标签
四、展现