策略产品案例丨微博搜索策略调研分析
调研时间:2018.12
调研对象:微博>搜索
调研目标:针对电影搜索的搜索结果分析并提出优化方案
调研范围:搜索推荐和用户画像仅做思考说明,不在抽样及优化方案中详细说明。在抽样时假设用户没有点击搜索推荐,都是自行输出完整内容后进行搜索。
产品目标
产品目标
用户在微博移动端针对电影搜索时,帮助用户高效的获取想要的结果。
搜索推荐:在用户输入时,准确预测其需求query,给出推荐引导用户点击。减少口语化和表达复杂的query的出现场景。
搜索结果:满足实时性、观点性、社交性、个性化
- 实时性:系统对用户搜索操作快速做出反应
- 观点性&社交性:用户可以看到丰富立场和观点的PGC&UGC内容,产生交流欲望,达成与其他用户在社区中的互动
- 个性化:微博的个性化,“随时随地发现新鲜事”,为用户展示符合微博定位的有时效性和热度的搜索结果。用户的个性化:展示更适合用户画像(信息、行为、环境)的搜索结果
策略框架
需求分析
需求理解
移动端用户搜索的主要场景:休闲时候;用户在外(身边只有手机可用);不想开电脑时候
衡量拆解
- 需求明确的query,搜索推荐的覆盖率和点击率;
- 每个query分析规则的召回率和准确率;
- 各需求的召回率和准确率。
抽样分析
1. 调研目标
调研微博针对电影的搜索结果,挖掘搜索结果不匹配用户搜索需求的问题,给出优化方案。
2. 抽样对象&方法&数量
不同需求类型的搜索query得到的前10条搜索结果,每个场景各抽取2个样本。
3. 样本分析标注
(1)需求明确-结构简单清晰的query
搜索结果
问题:
1)内容
内容无关-50%
仅仅是对query切词后进行了匹配,并未识别出query真正的含义。
2)排序
排序偏低-10%
query1推荐9中【豆瓣电影TOP250】是最符合用户需求的内容,虽然是第三方链接,可以适当降低排名,但是在第9的位置有些偏低,需要滑到第五屏才能看到。
3)展现
展示效果差-5%
【豆瓣电影TOP250】抓取的内容是WEB,未做自适应处理,展示效果比较差。
4)资源
未获取关联资源-25%
结果中有【无名之辈】电影名,而且还在热映中,关联的微博没有推荐电影主页。
关联资源获取错误-5%
电影名未被识别关联电影主页,名词被识别为电影名关联了电影主页。
关联资源获取缺失-5%
搜索结果中提到了3个电影名称,1个是在热映的query,其他2个已经下映,只关联了其中一个下映的电影主页。
(2)需求明确-口语化的query
搜索结果
问题:
1)内容
内容无关-30%&内容关联度低-15%
【大象席地而坐好看吗】未对query进行切词和同义词语义处理,直接进行了匹配。
把【大象席地而坐得了什么奖】中的【得了什么奖】直接纠错清除了,在搜索结果中没有看到【得了什么奖】的同义词或匹配内容,但是搜索结果和直接搜索【大象席地而坐】不同。
2)展现
展示效果差-5%
抓取了低质量内容,未做审核。
2)资源
未获取关联资源-20%
结果中有【大象席地而坐】这种电影专名,关联的微博没有推荐电影主页。
未获取展示资源-40%
两个query都有明确的电影名称,搜索结果都不足10个。
3)BUG
BUG-5%
跳转知乎,通过QQ登录,联调接口有BUG。
(3)需求明确-表达方式很复杂的query
搜索结果
问题:
1)内容
内容无关-25%
一部分结果识别出了query需求是【绿毛怪格林奇】,一部分结果将query进行了切词,同义语义未识别,把【什么奇】纠错清除了。
2)排序
排序偏低-10%
【绿毛怪什么奇】query的排序8识别出了query需求,关联了电影主页,匹配率比前几个搜索结果高。因为发布时间和热度(转发、评论、点赞)排到了无关内容的后面。
3)资源
- 未获取关联资源-5%
- 未获取展示资源-50%
【毒液适合小孩子看吗】未被语义识别,也未切分出【毒液】,无搜索结果。
(4)需求明确,对答案有特殊要求
搜索结果
上传限制可能导致图片模糊,回复“搜索”获取高清图片版本
问题:
1)内容&资源
内容无关-15%,资源类型不匹配10%
对query切词处理后,未识别出需求含义,消除了部分query,导致内容不匹配。
未将query中的【海报】转换成引擎可理解的特征,不满足需求对资源类型(图片)的需求。
内容关联度低-25%
搜索结果内容只是对query关键词一笔带过,query并非内容主体,对query语义和搜索结果内容都没有准确识别。
未获取关联资源-5%
2)排序
排序偏低-15%
两个query中,对内容匹配度和特殊要求(时效、资源类型)满足最好的两条结果因为结果类型>发布时间>热度的权重,分别排在第9和第6。
(5)需求不明确,需要进行需求拓展和预测
搜索结果
问题
1)内容
内容无关-10%
3个无关内容分别是同名电视剧、同关键词文章、同名歌曲。因为query不是严格意义上的专有名词,因此在拓展需求时出现与query相关但与需求不符的内容属于正常现象,在获取到用户行为时,根据上下文数据和个性化数据进行排序和过滤。
广告-3.3%
出现频率不高,在可忍受范围内,暂不处理。
2)资源
关联资源获取缺失-3.3%
在搜索结果内容中提及了4个电影名,只关联了一个电影主页,而且不是query。
问题汇总
优化方案&优先级
#作者#
紫原新之助,公众号:小紫原产品手账。长期关注&不定期输出互联网商业、产品、运营、增长思考&实践。
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!