大模型+搜索：一盘跳棋和三位选手

脑极体 2023-12-01 15:43:10

我们都知道，大模型必须诞生应用才有价值。那么，哪种应用才能最快发挥出AI大模型的价值潜力，成为大模型落地的第一站？提起这个问题，很多人会首先回答：搜索。

这一方面是因为，在ChatGPT爆火之后，“大股东”微软首先就将其能力融入到Bing搜索中，并且一度宣布要凭借大模型优势，把行业老大哥谷歌挑落马下。那么在中国AI圈大规模复刻大模型的背景下，在应用侧也自然会想到首先推进搜索+大模型。

另一方面，搜索引擎天然有着与AI深度结合的优势。早在2014、2015年，百度和谷歌这些传统搜索引擎巨头就开始将深度学习、知识图谱等AI技术融入搜索当中，以此提升搜索引擎对用户指令的理解能力，增强搜索结果的内在关联性。

由此可见，大模型+搜索，可谓是天时地利人和。经过近一年时间的探索，中国AI行业的大模型+搜索应用也逐渐丰富了起来。虽然大模型带给搜索的改变并没有彻底浮现出来，但已经形成了较为多样化的探索思路。

为了能让大家更生动了解大模型+搜索的目前进展，理解不同思路的差异化。我们想了一个比喻：大模型+搜索，就像一盘跳棋。各位选手手里的棋子都是一样的，即大模型技术与搜索技术。而他们的最终目标是一致的，即孵化大模型时代的第一个爆款应用。

但在下棋的过程中，各自的棋路却有不同。目前来看，它们分为三个流派。

一、选手一：大模型作为搜索引擎的增强插件

搜索，是互联网时代人与信息之间最为频繁的接触场景。搜索引擎既需要理解用户意图，也需要理解海量信息。作为信息与人之间的枢纽，搜索引擎提升智能水平的需求是永无止境的。

而大模型为搜索引擎带来的差异在于，它不仅能够加强传统搜索引擎的体验，还能够通过AIGC模式带来各种对用户意图与搜索结果的内容生成能力。

举个例子，大模型不仅能够提高搜索精准度，还可以把搜索出的多个结果合并生成到一个内容框里，节省用户时间。这相当于在传统的搜索框架外，给用户了一些额外的搜索工具。

基于这种思路，业界开始探索大模型+搜索的第一种模式：把大模型能力，当做搜索引擎的增强插件。在国内市场上，这个流派的代表是百度。

产品经理，产品经理网站

搜索业务，可以说是百度通过文心大模型能力进行产品改造的第一站。目前阶段，百度已经在搜索引擎中添加了两种基于AIGC能力的“增强插件”。

首先，是在首条回答中进行信息聚合。

在AI技术与搜索结合的过程中，百度非常强调“首条搜索结果即满足用户需求”的理念。而大模型能力，可以将搜索结果进行关键信息的聚合，从而生成内容摘要。基于这种模式，百度在搜索引擎中更新了首条回答能力，其覆盖范围不仅是文字信息，还可以通过大模型对视频进行理解从而归纳摘要。在这种模式下，加入用户想要搜索的结果在视频内容中，用户就可以不再去观看视频，而是通过首条回答直接得到视频内容的总结归纳。

百度公布的数据显示，过去首条搜索满足率只有40%左右，而在加入大模型能力后，这一比率达到了70%。可见大模型能力作为搜索引擎插件，是收获正向反馈的。

另一种“增强插件”式的大模型结合搜索，是在搜索栏之外专门提供一个AI对话栏，也就是百度搜索在今年5月移动生态大会上推出的“AI伙伴”能力。

AI伙伴可以与用户进行AIGC问答，帮助用户在使用搜索引擎时完成诸如答案标记、提供信息来源、总结文档概要等能力，同时还支持其他工具和服务的调用。

也就是说，百度在搜索引擎界面内，以及搜索引擎之外，都提供了基于大模型能力的AIGC插件，从而让搜索引擎获得多个角度的大模型重构。无独有偶，这一思路与谷歌将Bard聊天机器人整合到搜索引擎中非常相似

可见具有搜索引擎传统优势的厂商，更倾向于将大模型作为增强插件，多角度融入传统搜索引擎这种“1+1大于2”的思路。

二、选手二：类ChatGPT的搜索应用

在增强传统搜索引擎能力之外，大模型还带来了另一个问题：是否有可能绕开传统搜索形态，直接基于AIGC能力产生新的搜索产品？

在这种可能性上也出现了一些探索。ChatGPT本身即具备语义理解、多轮问答、内容生成等能力，从某种程度上看，这也可以看作是一种“搜索”。只不过搜索的内容从关键词变成了提问和需求，搜索结果从网页变成了直接生成文字内容。

于是，中国AI行业中出现的一种新型搜索产品，可以被称为类ChatGPT搜索。其中具有代表性的“参赛选手”，是昆仑万维推出的天工AI搜索。

产品经理，产品经理网站

这种搜索引擎完全以AIGC作为产品核心逻辑。用户通过自然语言来表达需求意图，随后搜索界面反馈出相关答案，而不再像传统搜索引擎一样展现大量网页链接。

相对来看，天工AI搜索的一个创新点在于信源索引。在使用ChatGPT等AIGC平台时，我们经常会面临一个问题，就是AI回答内容的不确定性。极多问题大模型都无法给出正确答案，甚至会胡乱编造论据、文献出处、新闻源等，也就是广受吐槽的“AI一本正经地胡说八道”。

而天工AI搜索则强调了生成答案的同时给出参考信息源，从而确保用户能够追溯信息的可参考性，极大规避了AIGC平台的信任难题。并且其参考信息源也相对丰富，包含了新闻网站、知识问答平台、视频等。

但在目前阶段，类ChatGPT搜索与AIGC平台的界限还难以区分，用户对其认知还不明确。这种模式有待于进一步的市场普及与用户检验。

三、选手三：大模型落地垂类搜索

在搜索引擎格局相对稳定之后，曾经出现过这样一种产业思路：通用搜索机会不大之后，搜索引擎可以在垂直搜索领域发力，从而夯实对该领域有持续搜索需求的用户群。搜狗搜索、夸克，都曾经在垂直搜索领域发力。其中夸克凭借垂直搜索能力，在年轻用户群中获得了不错的成绩。

大模型+搜索的第三种思路，是将大模型率先落地在垂直搜索当中。以此强化具体搜索领域的自然语言理解能力与信息检索体验。在这个领域，目前的代表选手是夸克。11月14日，阿里巴巴智能信息事业群发布了夸克大模型。立足于自身的差异化定位，夸克大模型应用会优先落地在专业搜索等信息服务领域。而除了基础的大语言模型之外，夸克大模型还将衍生出医疗、教育等垂类模型，可见夸克对专用知识领域的重视程度。

目前来看，医疗、教育、人文社科，是大模型落地垂直搜索的几个主要方向。这几个方向都对信息源有着极强的要求，并且存在关键词模糊、有效信息较少、逻辑性较强等特点，相比于通用类搜索来说，更加适合大模型发挥出自己的特性。同时，优先将大模型与垂直搜索进行结合，也可以很好地降低产品成本，提升大模型的应用于搜索领域的整体效率。

事实上，还有一种垂类搜索与大模型结合的变体，就是各家网盘目前都在上线具备自然语言理解能力的搜索功能。可以通过模糊描述、形容词等关键信息来检索网盘资料，尤其是对图片、视频等内容进行搜索。

四、都是超级应用的跳板

那么问题来了，到底哪种模式才是大模型+搜索的正确解答呢？

不好意思，答案只能是虚席以待。

大模型+搜索，是一个在逻辑上非常具有前景的大模型落地场景。因此在ChatGPT刚刚开始爆火后，微软就将大模型能力打造为BingChat，并对谷歌搜索放出了诸多狠话。但时间过去了快一年，微软已经将很多AI能力剥离出了搜索业务，而谷歌的市场霸主地位也没有受到什么影响。可见这一场景从理论到实践，还有不断的路要走。

回望国内市场，会发现三种探索模式还各自为战，并没有产生太多交锋，在用户侧也没有掀起对大模型+搜索的普遍认知，甚至其落地程度远不如类ChatGPT的对话应用本身。究其原因，可以发现三点：