从0到1搭建策略产品系列:搜索
思考一个问题:什么是当前最主流的策略产品方向?
无疑就是搜索和推荐了。
大家可以仔细观察一下,目前互联网产品,基本99%会有搜索和推荐场景。
为什么?这还要从每个业务的用户流量结构说起。
一、用户的流量结构
其实,对于一个用户端产品来说,当一个用户进入你的产品,那么基本可以分为两种类型:无非就是有明确需求的用户和没有明确需求的需求。
因此,基于这个出发点,典型的电商为代表的业务,在他们的APP内以综合流量分发为主的首页基本上都是采用一样的流量分发思路,总体结构下图所示:
比如京东,淘宝,美团等等。
为了尽快满足有明确需求的用户,搜索在最顶部,下面的垂直业icon,比如超市、服饰,电器等等,其实也都是为了满足更加聚焦,且明确的用户需求;
对于没有明确需求的用户,他们会继续下滑,那么这部分流量基本上是以个性化推荐feed流来进行承接。
因此,其实对于策略产品来讲,了解如何搭建一个推荐系统,以及搭建一个搜索系统,基本上能够cover大部分策略场景。
今天我们一起来看一下如何从0到1搭建一个搜索策略产品。
二、搜索场景介绍
搜索的产品场景都有什么?通常大多人认为的搜索就是一个搜索框。
其实不然。
搜索常见的产品场景主要包括三种:搜索框、搜索中间页和搜索结果页,具体到每种场景下又可以细分为很多小场景:
- 搜索框:搜索框,框下词,框内暗纹
- 搜索中间页:搜索联想词、搜索直达、历史搜索词、热门搜索词、搜索推荐
- 搜索结果页:顶部直达、排序筛选、搜索结果feeds流、穿插广告位、banner位等等
但是,不管是在哪个场景,他们每一个追求的根本目标都是一样的,都与搜索的核心目标保持高度统一:那就是满足目标明确的用户诉求,起一个精准流量分发的作用,促成快速成交。
所以我们在各场景下制定具体策略也是从这个核心目标出发,以此为前提进行策略需求可行性的判断。
三、搜索核心流程
接下来我们看一下,搜索是怎么完成一个闭环,以及我们如何从0-1去搭建搜索核心架构?
其实搜索大家总体上可以理解它在做两件事情:
- 明确用户在搜索什么
- 给用户展示什么东西
我们首先来看第一步,搜索是怎么知道用户在搜索什么?
搜索一般是从用户输入关键词的时候开始,也叫query。
当我们拿到用户输入关键词之后,需要对关键词进行处理,比如常见的分词,属性识别,并且最终把用户想要搜索什么识别出来,这个就叫意图识别。
通过意图识别模块,搜索基本知道了用户在搜什么东西,比如牛奶,还是手机。然后根据它的判断,接下来其实就根据这个意图去找到符合意图的物品。
四、索引构建
存放物品信息的地方,叫做索引。通过了解用户的搜索意图,我们与物品池的物品进行匹配,然后把满足条件的物品取出来,这个过程叫做召回。
当知道了给用户展示哪些物品之后,很关键的一个流程就是这些物品以一个什么样的顺序给到用户,这个很关键。排序靠前,意味着物品先被用户看到,意味着得到更多的曝光,也意味着会获得更多的转化。
很多人在做搜索的时候,只关注召回和排序,其实索引层面往往才是我们容易忽略的一个点,在搭建搜索之前需要好好的进行盘点,有助于高效,精准的给到用户想要的商品。
接下来我们重点看一下索引模块。
1. 物品索引
在电商平台上,我们通过搜索关键词,找出我们想要的商品,这个搜索过程是怎么实现的呢?其中就是利用我们输入的关键词,去跟商品做匹配,从而展示给我们匹配的商品;那么这个过程会涉及到商品库所搭建的索引。
2. 什么是索引?
在搜索引擎中,索引即是为了数据可以被检索到,基于目标内容创建的一种存储结构;用名词理解,索引即为数据库;用动词理解,索引即是存储一个文档到数据库中,使它可以被检索到;
这里需要引入另外的索引概念:倒排索引。
那倒排索引又是什么?
倒排索引:实现比关系型数据更快的过滤。特别他对多条件的过滤支持非常好,可以提升数据检索速度。
现代搜索引擎绝大多数的索引都是基于倒排索引来进行构建的,这源于在实际的搜索场景中,用户往往在进行查询信息的时候,只输入某个信息中的某个关键字;比如我们不记得电影的名字,通过某个电影片段进行查询;
面对这些海量的查询信息,我们需要效率更快的查询方式,也就是倒排索引;
有个简单的例子来理解倒排索引的匹配方式:
请你说出带有“月”字的诗句,并说出古诗名:
也就是说,如果匹配方式是正排索引,那么需要把每首诗从头到尾都检索一遍,命中再匹配相应的诗名,这种方式效率会非常低;
3. 如何进行索引搭建?
在搭建索引之前,需要对商品属性进行盘点,主要关注以下3点:
- 现阶段商品都有信息,商品打标的方式是人工还是机器,覆盖率和准确率如何?
- 用户近x天搜索词,相对应的商品属性是什么?哪些现在有,但没有添加进索引;哪些现在没有,需要新增属性。
- 商品属性,哪些是重要的,哪些是次要的;
以上三点主要围绕着用户需求来进行,商品属性准确与否直接关系到用户体验,比如搜索“V领连衣裙”,其中有个商品标题写着V领,实际是方领,在用户感知层面除了搜索不准确,还会消耗平台的公信力;
那么,在盘点好以上三点之后,可以把商品属性进行索引分类,整理成商品画像,需要区分主次(主要用于召回);规整之后即可添加进搜索引擎;如果覆盖率与准确率较低,需要同时优化商品信息的覆盖率与准确率;
图示:服装商品画像
4. 关于商品画像
商品画像是商品属性的集合,它能表述一个商品有什么特征。
比如常见的商品属性有品类、领型、袖长、廓形,那集合起来的就是一个商品的画像,它表述的是这个商品的特征,比如说长袖V领的T型连衣裙
说起商品属性,有些读者会很疑惑,比如说:商品属性的维度应该怎么划分?我应不应该把商品属性给功能化?或者说,商品属性需要支撑到什么程度?
先说说商品属性的维度划分,商品属性维度应该怎么划分应该回归到平台具体的商品品类结构以及业务形态;比如说,平台的业务就是主营服装,那么在商品规格里面也就没有手机商品的相关属性,自然在划分的时候也就有所区别;
那商品属性的功能需要支撑到什么程度?
这里依旧需要回归到业务场景,如果平台业务是面对外部企业,需要衡量标签的使用场景以及使用频率;如果平台业务面对的是内部员工,需要和商品企划的同学细聊商品企划的场景,去衡量商品标签需要支撑的价值点:比如商品分析、抓款投放等等
商品属性更新机制。根据业务情况制定更新机制,平台活动较多,对商品信息更改较为频繁,可以为即时更新机制;商品基本不变,可以为t+1更新机制等等。
总之,索引是搜索的基础,一个好的索引才能保证用户搜索结果的准确性和有效性。一个很典型的常见是当你的无结果率很高的时候,大概率是索引出现了问题。
作者:策略产品夏师傅 公众号:策略产品夏师傅,京东美团阿里快手高级策略产品专家,搜索业务负责人版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!