微博搜索策略分析
一、调研目标
研究新浪微博在不同需求场景下的搜索效果,提出优化方案,以满足用户高效获取信息的需求。
二、调研分析
参照网页搜索策略的思考方式,将从需求明确度、query特点以及对结果的要求对微博搜索存在的不足进行分析:
图1 调研分析
1. 需求明确
参照网页搜索策略的思考方式,将从需求明确度、query特点以及对结果的要求对微博搜索存在的不足进行分析:
(1)query结构简单清晰
场景一:搜索“电影龙猫”
搜索词:电影龙猫
期待结果:关于新上映的电影龙猫的讨论
实际结果展示:
搜索结果分析:
搜索结果满足了用户的基本需求,第一条为电影《龙猫》的介绍,从第二条到第四条都是知名博主的点评,但是再往下的信息只是含有“龙猫”字眼,比如明星和博主的吐槽以及日常陈述、博主的影视推荐,没有《龙猫》的其它有效信息。
从query可看出,微博对搜索词做了切词处理(有的不含“电影”字眼),但没有进行相应的的语义分析。在前面4条的信息中,热度和相关性较高,可以满足大部分用户的需求,但在后面的信息中,只要query切词中有相关的关键词与最新消息区配,系统将依据热度进行信息排行,这就导致相关性降低,推送结果与用户预期不符的情况。
场景二:搜索“演员宋仲基”
搜索词:演员宋仲基
期待结果:关于宋仲基的最新动向
实际结果展示:
搜索结果分析:搜索结果基本满足了用户需求,第一条为官微热门,是宋仲基的最新消息,满足需求。再往下看,大部分信息仍是满足需求的,但是同样存在切词的问题,如:博主的日常陈述中是含有“宋仲基”字眼,但没有其它有效信息,这同样是query切词匹配的问题,这是问题一。
除此之外,每个专题下有大量重复信息没有得到系统的筛选,加大了用户获取差异化信息的成本,如:宋仲基主演的电影《波哥大》暂停拍摄这条消息被不同的博主连续频繁推送,这是问题二。
(2)query口语化
场景三:搜索“感冒吃什么药好的快”
搜索词:感冒吃什么药好的快
期待结果:推荐治疗感冒药的相关信息
实际结果展示:
搜索结果分析:搜索结果基本满足。
第一条是推荐的是热门文章,与“query”非常吻合;第二条热门问答视频,标题与“query”非常吻合;第三条是行业官微直接提供了与“query”吻合的解决方案,可以说前三条是非常满足需求的;
到了第四条、第五条,直到第二条,大量的博主日常生活的记录了,记录中有感冒、吃药这样的字眼,这说明系统也只是做了简单的关键词的匹配,并没有理解用户真正的需求是找到治疗感冒的药,这是问题一。
更甚者,十条以后,居然出现“鸡感冒了怎么治疗,鸡感冒了吃什么药最好?”的信息,说明系统没有进行语义上的推理,即——用户在搜索时前面没有加“人”此类的主语,应该默认为人感冒了,如果是动物肯定会在搜索时加猫、狗这样的习惯,没有进行语义上分析,这是问题二。
另外,从query角度来讲,切词为“感冒+吃+药+什么+好+的+快”,query匹配度是非常高的,切词也无明显丢掉、重组的现象,但是系统并没有对query背后的搜索需求做深度的挖掘,“感冒”是症状,“药”是方法,其前面加了“什么”,显然是在找解决方案啊,当然,也属语义分析的问题。
场景四:搜索“矫正牙齿得多少钱”
搜索词:矫正牙齿得多少钱
期待结果:推荐矫正牙齿的价格信息
实际结果展示:
搜索结果分析:
搜索“矫正牙齿得多少钱”,微博中只推送了三条信息:
- 第一条是广告,而且是与“query”完全无关的广告,不满足需求,且用户需要往下翻页继续找相关信息,增加了寻找信息答案的成本,这是问题一;
- 第二条是一篇与“query”吻合度极高的文章,但是文章内容限制在深圳罗湖,不够全面;
- 第三条是博主的求助信息了,同样没有得到答案,也不能满足信息。
由此可见,微博中对于“矫正牙齿价格”的信息资源是非常少的,或者是系统设计的相关度太低以至于没有推荐出来。
(3)query表达方式复杂
场景五:搜索“新一对小兰表白是在哪一集”
搜索词:新一对小兰表白是在哪一集
期待结果:想知道“新一对小兰表白”是在哪一集
实际结果展示:
搜索结果分析:基本能满足需求,但存在两个问题:
- 前两要推送的依然是博主的日常包含有与query相同的关键词的相关信息,网友给出答案,但是用户不能通过摘要立即看到结果,需要再点击继续从上往下寻找答案,这个过程虽然满足了需求,但是仍然增加了获取有效 信息的成本;
- 后面一条又是广告,用户仍需要往下翻页继续找相关信息,增加了寻找优质答案的成本。
场景六:搜索“我真是大笨蛋,除了喜欢你,我什么都做不好”是哪个电影里的台词
搜索词:我真是大笨蛋,除了喜欢你,我什么都做不好是哪个电影里的台词
期待结果:想知道这句台词的来源
实际结果展示:
搜索结果分析:前两条能满足需求,但是基本是对问题的间接回答,第三、第四甚至到第十条都是博主的心语,只是对query进行了简单的匹配,而且从结果中我们可以看出,query被切词为“我真笨蛋,我除了喜欢你,我什么都做不好”+“是”+“哪个”+“电影”+“里”+“的”+“台词”,显然,出现了明显的丢掉现象。
2. 需求明确,对结果有特殊要求
场景七:搜索“北京最新房价”
搜索词:北京最新房价
期待结果:想知道北京的最新房价
实际结果展示:
搜索结果分析:
满足需求情况较好,即北京、最新、房价,推送的结果不仅与北京房价相关,也满足“最新”这一特殊需求。笔者认为,这跟query是热点问题有关,也跟系统中也有官微的信息资源有关。
场景八:搜索“北京最新房价”
搜索词:华为最新款手机
期待结果:想知道华为最新款手机的相关信息
实际结果展示:
搜索结果分析:
满足需求情况不好,第一条推送的是关于华为的热点新闻,跟用户需求——最新款手机不匹配,这说明系统的推荐对热点的依赖太高,这是问题一;第二条推送是华为最新款手机的功能、价格,满足需求;第三条,推送的是一条语义理解意义的资讯,query切词为“华为+最新+款+手机”,显然切词后出现了重组现象,但是结果基本满足需求;第四条推送的一条无相关广告;第五条推送的是与query吻合度极高的热门文章,满足需求,但是需要点击进去后才能得到答案。
总得来说,搜索结果依赖于热度和更新时间。
3. 需求不明确
场景九:搜索“秋冥”
搜索词:秋冥
期待结果:了解何有英《秋冥》这幅画的相关信息
实际结果展示:
搜索结果分析:
基本不满足需求。系统不知道《秋冥》是什么?最好的结果也就是找到了与“秋冥”这个关键词匹配的信息,却不是笔者期待的结果。
场景十:搜索“三体”
搜索词:三体
期待结果:了解《三体》这本书的相关信息
实际结果展示
搜索结果分析:基本不满足需求。前面三条推送的都是只含“三体”这个词,与《三体》这本书的内容信息无关;第四条更是推送了与《三体》无关的广告;第五条,终于是与《三体》这本书及其作者的信息了;但是,第六条,又与期待结果不匹配。因此,如果要获取精准信息,需要对搜索词进行扩展。
从以上10个场景的调研分析可知,微博搜索的不足集中在以下几个方面:
- 推荐顺序:微博的热度和最新时间权值过高,忽略query的匹配度。
- 信息重复:重复信息过多,用户在有限时间内获取差异化信息的成本加大。
- 语义理解:主要依赖query与信息资源的文字信息的匹配度,不能理解query背后的真实需求。
- 广告置顶:微博对广告的过度推广分散用户高效获取信息的精力。
- 热门query和冷门query的处理方式单一:基本是基于热度、最新以及query有匹配的原则推送,导致推送结果有大量无效信息。
- 语义转换:query口语化与书面推送结果差异很大,如:“矫正牙齿得多少钱”和“矫正牙齿价格”。
- 展现形式:答案有的不够一目了然,有的热门文章中、问答专题中包括query搜索答案,但搜索结果中因只有标题,没有摘要,答案不能一下子就能找到,用户必须得点击进去再继续挑选才行,再加上相关的关键词没有标识,如漂红。
三、优化方案
根据上述调研结果,总结微博搜索在不同场景下的不足,依据用户场景和展现结果满足情况两个方面进行问题的拆解,程序智能给出个性化的解决方案,满足用户高效获取信息的需求。
本文作者 @Alian
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!