产业，到底需要什么大模型？

脑极体 2023-09-06 15:07:55

写下这篇的起因，是前不久的一件事。

我们参与了一个大模型与行业结合的主题论坛。活动结束之后，来自行业主办方的一位代表跟我们交流时却说：“你们一直在说大模型。到底什么是大模型？多大才算大？为什么不能用小模型？”

这一系列问题又一次让我们意识到，智能化的供需双方很多时候根本处在两套话语体系。你这边Transfomer、Agent的说了半天，那边可能还在好奇大模型这三个字到底是怎么来的。

这种隔膜，在AI时代尤为严重。因为AI技术涉及的链条更长，做算法的、做云的、做硬件的、做IT解决方案的，以及最后买单的，大家可能在各说各的，谁也没打算真正理解谁。

今天，各家都在说产业大模型、行业大模型。确实从技术逻辑上看，很容易发现大模型能够给很多行业带来巨大的生产力释放，而从技术路线上看，中国企业对智能化的接受度更高、需求更强烈。大模型走向产业实现数实融合，是中国AI最具特色的一条脉络，在数字中国的大背景下具有极强的宏观战略意义。

但在实践中，这条路却充满了挑战与误解。

毕竟AI算法公司做toB，十家有九家做不成。在大模型toB的新机会窗口前，我们首先要确定产业究竟需要怎样的大模型？

一、产业大模型，就不是一种模型

AI公司做大模型结合行业，最大的误区在于搞不清供需关系。

诚然，目前行业对大模型的认可与接纳程度已经比较好，但智能化项目依旧是一个绝对的买方市场。技术供应商需要去适配最终用户的需求、能力、背景，甚至沟通话术和商业习惯。

但由于做AI大模型的公司，涌入了大量互联网领域的人才和资金。互联网的供需逻辑是单点供应对大量需求，我有一招鲜天下涌进来。而大模型在很多行业的适配又是很容易就能想到的。比如工厂需求配料分析，银行需要投资分析，那我的大模型不是都能分析吗？

于是，在这样的“风口思维”下，很多AI公司陷入了一个巨大的误区：他们认为我有大模型，各行业的客户都应该来找我。我推出两三个行业的案例，其他行业都应该认可。我的这个大模型哪里都能用，所以它就叫产业大模型。

无论这些AI从业者是真的相信大模型等于产业万金油，还是仅仅是故意吹成这样。在产业客户看来，这一幕就等于胡说八道。他们会觉得，金融业用的技术，关我煤矿什么事？如果有一种食品，说是猫能吃牛能吃人也能吃，你敢吃吗？

产业需要大模型做的第一件事，就是不要笼统的天差地别的各个行业归纳为“产业”两个字就结束了。即使在某个行业内，大模型都仅仅能解决行业的一个或几个问题，更不可能有一种模型能够“包治百业”。

做IT的都知道，有产品更要有服务，懂技术更要懂行业。但做AI的企业，尤其是拿着热钱涌入大模型赛场的企业，普遍对产业需求的差异性缺乏了解和尊重。

当然，不同行业对大模型的需求也有共通之处。比如对基础的对话、CV、多模态能力。但更多的情况下，每个行业的只能用意愿、基础数字能力，乃至安全需求、时延需求、运维需求都不相同。在今天的阶段，一种大模型能够在具体行业内复制推广已经非常不容易，更别想一口吃下几个甚至几十个行业。

产业智能化，优先级永远是产业大于智能化。

二、不提硬件和工程化，约等于瞎耽误功夫

很多做数字化、智能化的企业，在看了客户环境之后会奇怪这么一件事：客户花了大钱买回来的东西，其实就是很简单的软件封在一个盒子里，然后按照行业要求做了点按钮、UI之类的东西。甚至这些软件很多都是国外很古早的开源软件进行再封装，技术上早就落后了。这时他们会感叹，行业客户的钱可真好骗啊。

可是问题来了，如果我们换个角度思考这个问题，要是没有这层封装，企业要怎么用呢？难道一家工厂、一座矿山、一片林场，要招来和培养一大堆云计算、AI算法层面的人才？而且要让这些数字化人才指导整个企业的生产、运营和销售？这显然是不靠谱的。

所以，一个有点反常识的事实是，相比于天花乱坠的先进技术，行业用户往往更在乎那层“壳”。那层壳就说硬件化和工程化，是将技术能力按照最终的使用需求进行封装、管理和维护。虽然最后组装出来的东西可能很难用，可能不先进，但对于行业用户来说，有的用，员工能学会，才是智能化的最重要条件。

在讨论行业大模型时，今天也经常会陷入这个误区。从业者往往过分关注算法层的领先性、国际性，跟参数规模和测试纪录较劲，把目光聚焦在软件上。但行业需要大模型做的，是跟此前的数字系统较劲，跟使用成本较劲，跟操作门槛较劲。这就需要大模型考虑硬件环境、网络环境、存算资源、操作系统，甚至考虑部署环境的电力供应、湿度、温度。

产业大模型要做的第二件事，是必须兼顾硬件适配和工程化问题。

大模型能否落地，都在说要找准场景。但什么是场景？最后能起作用的那个地方才叫场景。

绝大部分企业，都不是IT为导向。甚至大部分企业根本无法派专人去仔细了解什么是大模型。这个事情在漫长的时间里都无法改变。

山不会过来看你，所以你要去看山。

很多人把大模型比作一座金矿，那么训练大模型仅仅是挖到金矿，通过工程化方法，讲大模型融入到行业已有的数字化基础设施，才是把金矿运出山。