面对现阶段AI工具的痛,B端系统如何走完AI工具落地的最后一公里
随着AI技术的不断发展,各类AI工具层出不穷,许多岗位已经深度应用了这些工具。例如,在翻译场景中,AI翻译工具能够提供符合业务格式和文风要求的翻译;在作图场景中,AI生图工具可以生成草稿和半成品。由此可见,AI工具目前已经在各行各业中显现出显著的降本增效作用。
但事实上,当前的AI工具市场正处于一个野蛮生长的蓝海阶段,这意味着利用这些AI工具来进行业务降本增效必定会存在以下痛点:
1. 较高的试错成本
当前市面上的AI工具数量繁多,各家提供的功能和质量参差不齐,导致存在极大的信息差。在某一AI工具门户网站下,仅“AI图片背景移除”这一项就收录了近30个不同的AI工具。
因此,当我们需要某个特定的AI功能时,很难快速找到最符合业务需求的工具。这就需要我们逐个尝试这些AI工具,利用业务数据进行模拟测试,并评估其效果。这个过程相当耗费成本,主要包括以下几方面:
1)人力成本:
由于AI工具通常由第三方平台开发,因此需要注册相应平台的账号,并设计一套评测方案(包括测试集选择、指标体系建立等),最终评选出最适合业务需求的工具。
然而,这并不意味着评测工作可以一劳永逸。由于AI工具更新迭代速度极快,目前的最优解可能很快就会被新的工具取代。因此,我们需要定期测试市面上的最新AI工具,并更新我们的工具选择。此外,不同AI工具由于使用的训练集不同,在不同案例中的表现也会有差异。如果我们的业务内容变化较大,也需要结合业务的变化重新评估AI工具的效果,以找到新的最优解。
有人可能会问:“为什么不能通过第三方门户网站推荐或用户推荐来找到最优解呢?”这是因为这些推荐通常基于通用场景,而不是特定行业的需求。在通用场景下表现良好的AI工具,可能在某些垂直行业中表现不佳;反之亦然。因此,在当前垂直领域信息缺乏的情况下,只能通过逐个尝试来找到最优解。
2)工具购买成本:
虽然市面上有不少免费的AI工具,但其效果往往不如付费工具。为了找到最优解,通常需要购买一些付费工具,这也会带来一定的成本。如果涉及的工具较多,这笔费用也不容小觑。
尽管这笔费用对大部分公司来说并不算大,但主要成本仍集中在人力消耗上。
2. 较割裂的使用体验
假设业务通过一定成本的试错,找到了N个最优的AI工具,那么在实际操作中,业务需要在这N个AI工具之间频繁切换。这涉及多个平台之间的跳转、文件传输等操作,导致效率大打折扣,降本增效的目标难以实现。
以图片生成业务为例,设计师用AI从零生成一张图片可能需要经历以下步骤:
i) AIGC工具文生图:使用提示词生成N张图片,从中选取可用的背景和人物。
ii)AI图片背景/物体/人物抹除:从文生图的结果中抠出所需要的背景、物体和人物。
iii)组装合并:使用图片编辑工具组合背景、物体和人物,生成一张所需的图片。
iv)AI滤镜/转绘/扩图:对合并后的图片进行进一步处理,生成目标图片。
v)AI无损放大:由于AIGC生成的图片尺寸不一定符合业务需求,需要使用AI无损放大工具生成合适尺寸和分辨率的图片。
按照上述步骤完整生成一张图片,可能需要用到多达8个AI工具。设计师需要在这8个工具之间频繁切换,上传和处理图片。这种割裂的使用体验无疑增加了设计师的工作成本。再考虑到AI工具的不稳定性和试错成本,当前AI工具的使用成本显然非常高。
3. 工具成本累加
前文提到,通过一定成本的试错,我们找到了N个最优的AI工具。这意味着我们需要支付以下费用:工具A使用人数 * 工具A成本 * 工具A订阅时长 工具B使用人数 * 工具B成本 * 工具B订阅时长 ……
当使用的工具较多、团队成员较多时,这将是一笔可观的成本,甚至有可能不如聘请一个外包/实习生更为经济。
“试错成本”、“使用体验割裂”、“工具成本”,这些问题是阻碍团队进一步利用AI工具降本增效的瓶颈。但这些问题的存在其实有一定的客观原因:
1)市场处于蓝海阶段:目前,AI工具市场仍处于蓝海阶段,信息差异巨大。要客观了解市场上工具的能力水平,必然需要大量的试错成本。并不是所有企业都能意识到这一点并愿意花费成本进行试错。
2)工具的标准化:由于市场处于初级阶段,大部分AI工具优先保证自己的MVP(最小可行产品)和PMF(产品市场契合度),这意味着大部分工具都是在做标准化的通用解决方案,而不是满足企业的定制化需求。因此,对于业务流程繁琐的企业来说,AI工具的提效程度有限。
3)缺乏一站式解决方案:同样由于市场处于初级阶段,尚未出现超级巨头,也没有一个“All in one”的工具。这导致很多工作流程分散在多个系统上,造成使用体验的割裂。
因此,在B端企业领域,AI工具距离真正实现“降本增效”还有最后的“一公里”。作为一个B端产品经理,面对市场上琳琅满目的AI工具及其痛点,我们可以帮助企业走完AI的这最后一公里,帮助企业在AI工具的蓝海阶段抓住机遇,快人一步。
一、如何走完最后一公里?
个人认为,要走完最后一公里主要有下面几个步骤:
1. 挖掘业务所需的工具
首先,我们需要明确业务所需的工具类型,以便为后续的研究指明方向。尽管当前市场处于蓝海阶段,但已经有不少优质的信息源出现,如门户网站、评测视频、AI相关公众号和社区等。因此,我们可以通过这些信息源了解市面上的AI工具,并收集适合我们业务需求的AI工具方向。
当前AI工具种类繁多且不断迭代,难以使用统一的方案进行类型划分。以下是我尝试的一种分类方式,分别从内容模态和处理方式进行分类。
1)内容模态分类:
内容模态指内容的形态,大致可分为文本、音频、图片、视频、3D模型。
这些内容模态可以进一步细分,某些类型的组合还可以形成新的类型。例如,3D模型/视频 音频可以形成数字人,图片 文字可以形成PPT类型。
2)处理方式类型:
基于上述内容模态,我们可以将处理方式分类,包括但不限于以下几种:
i)思考:理解某类内容中的信息并将其描述出来。例如,对一段新闻进行提炼的AI文字总结工具,或对一段视频进行提炼的AI视频总结工具。
ii)生成:通过用户输入的信息与预设的参数,直接生成某类内容,即AIGC(人工智能生成内容)。常见的如SD、MJ等工具,Chatbot也可以归类为此类型,因为它通过用户的聊天和预设的场景进行响应。
iii)编辑:在某类内容生产过程中进行修改和编辑,常见于图片、视频、音频、模型等美术素材生产环节。例如,AI抠图、AI图片扩展、AI去水印等。
我们可以通过“业务所涉及的内容模态”和“业务环节中对内容的处理方式”快速定位所需的工具类型。
当然,我们也可以通过绘制业务流程图来辅助挖掘所需的AI工具。如下图所示,在图片宣传素材生产环节中,可能用到的数据采集、图片分析、图片生成、提示词工具、图片扩展、一键抠图、去水印、批量修改等工具。
2. 知己知彼,熟悉工具
当前AI工具市场处于“竞争激烈的蓝海阶段”是一个不可否认的事实。要在这个环境中有效利用AI工具,必然需要花费一定的试错成本来了解相关工具。
然而,我们可以采用科学的方法来减少试错成本的浪费:
1)通过信息采集渠道初筛:
通过前文提到的信息源(如门户网站、评测视频、AI相关公众号、AI相关社区等),我们可以获取AI工具的一手资讯。虽然这些资讯不能直接告诉我们最优解,但可以辅助我们对AI工具进行初步筛选,为后续的评测提供方向。
2)科学合理的评测机制:
科学且合理的评测机制是事半功倍的关键。以下是一个科学且合理的评测机制的步骤:
i)评测工具初筛:
我们无法对所有AI工具进行全面评测,因此需要一些手段进行初筛。可以使用具有业务代表性的数据进行快速测试。如果某个AI工具在初步测试中表现不佳,通过调整提示词和参数也无法优化,且官网上没有相关的行业案例展示,口碑也不佳,那么我们可以直接放弃这个工具,避免浪费时间。
ii)AI工具熟悉:
通过初筛选出的AI工具后,我们需要对这些工具有初步的认知。可以通过官网教程、用户手册等途径进行了解。这一步的目的是充分发挥工具的价值,避免因使用不当导致的误判。
iii)设计评测指标:
结合业务需求设计评测指标,能够对多个同类工具进行量化对比,从而选择最优解决方案。例如,对一款视频风格转绘工具进行评测时,可以列出“风格符合度”、“帧数稳定度”、“主体识别准确度”、“成本”、“生成时间”等指标。这些指标需要能够准确描述AI工具的优劣,以便在后续评分时进行快速选择。
需要注意的是,部分指标偏主观判断,因此需要人工梳理评分标准。比如:
我们需要清晰地定义“每个评分等级的标准”和确保“团队成员在评测时理解一致”,保证即使进行团队评测,也能够较为公正地进行AI工具评测。
iv)选取测试样本:
基于评测指标,使用具有代表性的测试素材在不同方案上进行测试。这些素材需要具备以下特征:
-具有一定量级,不能仅仅一两个,否则难以测试出结果。
-在某些方向具有代表性,能够测试出不同方案的不同指标情况。例如,在视频风格转绘工具评测时,选择角色众多的视频,以测试多主体识别的准确性。
v)执行并记录评分:
将样本在AI工具上批量测试,并记录相关结论和截图。由于这一部分评价偏主观,最好由同一批人进行评价。
通过以上步骤,我们可以科学地选择出在某个方向上表现最佳的AI工具。
3. 接入各类AI工具
基于调研结果,我们需要将所需的AI工具接入内部业务系统,以提高业务效率和效果。
根据接入需求,AI工具可以分为开源和闭源两类。
1)开源工具:开源工具是指那些源代码可以被公众使用、查看、修改和分发的软件项目。通常可以在技术论坛上获取源码,并结合企业自身需求进行定制化开发。
2)闭源工具:闭源工具是开源工具的对立面,指那些不符合开源许可条件的程序。闭源工具往往需要付费使用。
从效果上看,付费工具通常表现更好,但这并不绝对。因为闭源工具可能无法完全满足特定行业的定制化需求,而开源项目则更具定制化改造的可行性。
市面上的AI工具不一定都有同等效果的开源方案,因此选择时需要权衡。如果一个AI工具同时具有开源和闭源方案,我们要比较“开源方案改造成闭源方案效果”的成本是否小于“直接使用闭源方案的成本”。如果开源方案更具性价比,则应优先选择开源方案进行开发;否则,选择闭源方案。
接入开源方案相对简单,只需获取源码,让技术团队进行解析,并将其组装到我们的系统中,进行必要的定制化功能或训练集改造。
接入闭源方案有以下两种方式:
1)接口接入:
如果第三方提供了功能接口,我们可以通过API接入,按需求调用第三方服务,并按请求量结算。
2)套壳方案:
如果没有提供功能接口,可以考虑通过爬虫或RPA(机器人流程自动化)工具进行数据输入/输出,将我们的B端系统与第三方服务结合起来,并使用第三方账号进行服务结算。
4. 基于业务的定制化改造
在完成AI工具的功能接入后,我们需要进行基于业务的定制化改造,使AI工具更贴合公司业务需求,真正实现赋能。整体过程可以分为以下几个步骤:
1)定制化微调:
第三方AI工具所使用的训练数据源通常是通用或行业常见的数据源,因此在处理公司特定业务时可能会出现较高的误差。为了提高AI工具的效果,我们需要进行定制化微调,具体方法包括:
i)参数优化:
通过熟练使用AI工具,我们可以在实践中总结出最优的参数配置方案。在内部使用时,预设这些最优参数配置方案可以减少业务的学习成本,提高整体效率。
ii)数据样本录入:
如果AI工具允许我们录入数据,我们可以采集业务实际生产过程中的数据作为训练集输入到AI工具中,从而优化其在我们业务上的输出效果。一般来说,开源方案支持这种操作,基于大语言模型(LLM)的工具也可以使用检索增强生成(RAG)方案进行数据样本录入。
iii)嵌套规则/模型:
在AI生成的结果上嵌套我们自研的规则或AI小模型,可以实现输出结果的修正。
嵌套规则/模型和数据样本录入的本质都是通过实际业务实践对AI输出结果进行修正。
2)贴合业务流程的调用方案:
为了避免使用体验上的割裂,我们需要将AI工具嵌入到B端产品的实际业务流程中,实现更低的“替换成本”,从而最大化“新体验-旧体验-替换成本”。
这个过程的主要步骤有:
i)梳理原有的工作流程:
在将AI工具融合到B端系统之前,首先需要详细梳理和了解业务的原有工作流程。这包括收集和分析现有的数据流、业务规则、决策流程以及各个环节的输入输出关系。通过深入了解业务流程,可以更好地确定AI工具的应用点和整合方式,确保其能够与现有系统和流程无缝衔接。
例如,在图片素材制作流程中,除了提示词、草图、成品的环节,还包括需求提出、修改调整、上架、复盘等环节。这涉及到业务上游和管理者的诉求。因此,美术资源生产环节往往围绕项目资产流程进行,我们的AI工具可以结合项目资产管理系统进行整合。
ii)将AI工具嵌入原有的输入与输出环节:
确定了需要结合的系统和需要替换的输入输出环节后,我们可以将AI工具整合到其中。在这一过程中,可以预设工具的结合场景参数,减少业务的学习理解成本。
例如,原本的业务输入输出环节为:业务上游输入需求,美术输出草稿,美术输入草稿和编辑需求,各类工具输出成品。
结合AI工具后的系统流程可以变成:业务需求方在项目资产系统上发起新建项目,结合需求描述生成提示词,并生成草图。美术设计利用系统集成的工具进行编辑,并上传终稿,最终由业务成员验收并发布到线上。由于整个流程都在线上,相关的工作进度和素材效果跟踪也能集成在系统上,减少管理成本。
iii)加入AI校验:
为了避免AI输出结果中存在误导性内容对业务产生影响,我们需要建立一套有效的验证机制。常见的验证方法包括规则过滤、AI过滤和人工审核,以此拦截具有误导性的内容,为AI幻觉问题提供保障。
在图片素材场景中,我们可以通过增加审核功能,使业务人员和设计师能够保证交付结果的质量。
四、小结
以上便是我个人的思考与总结。或许在未来,B端领域将会出现具有行业特征的AI工具,解决我们当前在B端应用AI工具时所面临的痛点。然而,那一天何时到来尚未可知,也不确定这种工具是否会覆盖我们所处的行业。
为了帮助企业在激烈的竞争中占据优势,我们仍需主动迈出这最后一公里,进行定制化微调和业务流程整合。只有这样,我们才能充分发挥AI工具的潜力,为企业创造真正的“降本增效”。
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!