AI大模型 电子合同=智能合同?大语言模型在电子合同中的应用及展望
如何通过大语言模型(LLM)提升行业中产品及服务的能力,是市场对AI技术应用落地的核心关注点。在法律行业中,数据形式以文本为主,且绝大多数都是基于法律条款的事实和真实案件,很适合大语言模型训练,天然是AI应用落地的绝佳场景。
本文将探讨国内外法律科技企业在电子合同中的应用,LLM技术的加持下带来的转变、难点及未来展望。请坐好,准备发车啦~
一、法律科技企业的全景图
法律行业的人工智能软件市场预计将从 2023 年的 9.4 亿美元增长到 2028 年的 32.9 亿美元,在预测期间(2023-2028 年)的年复合增长率为 28.50%(数据来源:Mordor Intelligence)。
图片来源:Mordor Intelligence
图片来源:Catalyst Investors
法律科技领域按服务类型分类
可分三大类产品:企业法务管理软件、法律执行管理软件、律师工作提效软件。
图片来源:LegalTech and Services – Houlihan Lokey
- 企业法务管理软件:帮助法律部门优化工作流,包括:合同生命周期管理、知识产权管理、法律知识检索与研究代表企业:Agiloft、iManage、ANAQUA
- 法律执行管理软件:帮助律师事务所管理和优化律师事务,包括:法律事务管理、律师人才管理、律师计费和时间管理等 代表企业:Aderant、LexisNexis、Clio
- 律师工作流提效软件:帮助律师提升法律服务效率,包括:合同自动化、合同智能审查、起草、诉讼等辅助软件 代表企业:Docusign、CS Disco、casetext
法律科技企业核心的商业价值在于合同全生命周期管理(包括:合同起草、合同审核、合同签署、合同归档及履约&续约、法律服务),而合同管理典型的应用场景就在于电子合同领域。
二、电子合同 vs. 智能合同
1. 电子合同解决了什么问题?
我们先简要分析一下电子合同相较于纸质合同的优势:
纸质合同的弊端
- 签署周期长:合同签约需进行快递邮寄,影响签约效率,存在不可控的风险;
- 签署成本高:除了合同打印成本邮寄成本外,还需要有纸质合同的存储及管理成本;
- 用印风险高:萝卜章事件、印章盗用事件都是用印风险问题的体现。
电子合同的优势
- 签署周期短:通过短信或链接的方式直接发送至签约方手机,线上实时签约;
- 签署成本低:相比于邮寄及纸质合同存储的成本,线上云成本更低,更高效;
- 风险可控:企业设置不同业务场景的审批流程,流程化进行管控风险(签署用印可管理,用印记录可追溯)。
所以,电子合同解决了签约过程中实效性,合规性与安全性的问题。让签署各方高效连接,快捷签约,提效降本。
2. 智能合同解决了什么问题?
电子合同:
电子合同解决的是签约过程中的实效性问题,重点在于签署时的高效、安全、合规,具备法律效益。
面向的客群是签署各方,解决的是合同签约的效率问题。
智能合同:
由AI技术加持下的电子合同,面向的客群是法务 / 管理者,解决的是签署前后环节中合同本身的风险合规问题与合同管理问题。
三、人工智能技术为电子合同带来了哪些转变
1. 传统以OCR、NLP技术为代表的AI技术 电子合同
OCR,光学字符识别:Optical character recognition
一句话概括:将手写或打印的图像,转化为计算机编译的电子文本。
OCR技术的核心是文字检测和识别:
- 文字检测:确定图像中是否存在文字,并给出文字的区域位置;
- 文字识别:根据文字区域的图像特征,将其转换为对应的文本。
OCR技术在电子合同的典型应用场景「合同比对」。
- 签约前:在草拟合同时,能够通过OCR技术识别出合同文件中不同版本之间的修改差异;
- 签约时:在接收到电子合同时,通过OCR技术快速识别签约的电子合同与之前协商的合同内容是否有一致。
NLP,自然语言处理:Natural language processing
一句话概括:让计算机像人类一样理解人类的语言。
NLP的技术能力包括:
- 文本分类:可识别文本背后所表达的情感与意图,用于情感分析与意图分析;
- 文本提取:可用于提取文本中的关键数据;
- 机器翻译:可进行不同语言翻译。
电子合同典型应用场景「合同审查」「合同归档」。
- 签约前:在合同草拟完成时,通过NLP技术自动对合同进行审阅,识别合同中的语法或文本错误,以及基于录入的规则判断合同中是否存在法律风险;
- 签约后:在合同签署完成后,通过NLP技术可自动提取合同中的重要数据,生成合同台账(包括:签约主体、签约时间、签约金额等)可视化进行合同跟进管理。
2. 以大语言模型(LLM)为代表的AI技术 电子合同
大语言模型:Large Language Model
一句话概括:利用深度学习技术,在大规模数据的基础上训练的自然语言处理模型,具备强大的文本理解和生成能力。
看起来是不是和NLP很相似,其中大语言模型只是NLP领域中的技术实现方式。「语言模型」是技术实现的方式,「大」说明用于训练的数据量足够大!并且LLM能够对特定领域专业知识,进行微调训练。其特点是能够学习并捕捉文本中的复杂关系,具备泛化能力,可处理更为复杂的任务。
3. 大语言模型(LLM)给电子合同领域带来了哪些改变
那定义咱们捋清楚了,大语言模型是基于足够多的数据进行训练而成,并且能够基于特定领域的数据进行微调,具备强大的文本理解和生成能力,广泛用于自然语言处理任务。
我们再回到主题,还是按合同全生命周期的不同节点来进行分析,来看一下大语言模型为电子合同领域带来哪些改变。
【签署前:合同起草环节】
在合同起草环节,客户可以根据需求,通过与AI对话的方式,自动生成合同文本与条款内容,从而提升合同起草效率。
国外企业:LexisNexis-律商联讯,推出的“Lexis AI”,可通过对话的方式,自动起草合同内容。也能在起草过程中,检索和让AI解释法律条款,从而对合同中的法规进行补充。
图片来源:Lexis AI
国外企业:Spellbook,以插件的形式融入word文档中,可对合同文本的内容进行文本生成,提供起草建议,也能纠正合同文本中的语法错误。
图片来源:Spellbook
【签署前:合同审查环节】
由于大语言模型能够基于法律、合同等相关数据进行微调训练,可从海量的合同文本中学习到胜诉或败诉的合同内容与法律条款,所以基于微调训练后的模型可以大幅提高合同风险审查的准确性,帮助用户发现潜在的问题与风险。
国外企业:Robin AI,可快速审阅合同内容,分析出合同中潜在的风险,并且能够针对风险内容进行修改。
视频来源:Robin AI
国内企业:幂律智能,在智普AI的ChatGLM-130B的基座模型基础上,训练了法律垂直模型:PowerLawGLM,并且推出MeCheck-合同审查助手的产品,用于合同审查业务,支持快速定位合同风险文本,提供专业风险提示、修改建议,法条判例自动援引。
图片来源:幂律智能-MeCheck
国内企业:法大大-iTerms,通过提取合同中的关键信息,基于不同业务场景,可自定义审查规则,从而实现系统自动识别合同风险,并给出风险建议。
图片来源:法大大
【签署后:合同归档环节】
可通过LLM的信息理解和提取能力,实现合同的自动分类归档、生成智能报表、并且能够对归档的合同进行检索查询与分析。
国外企业:Docusign-CLM,通过提取合同中的关键信息,如:签约时间,签约对象,合同金额等,自动归档至指定的合同文件夹,无需人工归档,释放人力。并且能够将合同数据可视化呈现,自动统计多维度合同数据,实时了解合同进度。
图片来源:Ducusign CLM
国内企业:上上签-Hubble,通过与机器助手的沟通,AI能够自动总结合同内容、提取合同中甲乙双方的合同义务,提升合同信息的获取效率。
视频来源:Hubble
【签署后:法律服务环节】
当遇到合同纠纷或需要法律援助时,具备海量法律知识的LLM-Bot,绝对是一个经济的选择,其使用成本远比请一个律师要低的多。
国外企业:DoNotPay,成立于 2016 年,总部位于伦敦。该公司开发了一款人工智能助手,可以理解用户的意图,并生成专业的法律文书。该助手还可以访问大量的法律信息,以帮助用户更好地处理法律事务。
图片来源:DoNotPay
国内企业:法狗狗,成立于2016年。旗下LogicQ智能对话系统,用户可以通过简洁易懂的案情输入过程,快速获得专业精准的案情结果预测和完善诉讼方案。
图片来源:法狗狗
【总结】
LLM相较于传统NLP技术在电子合同领域,深化了原有合同起草、合同审查风险识别、以及合同管理的能力。
- 传统NLP技术,以搜索关键词、配置规则和初步分析为主,比对某个合同段落是否涉及风险,引用至哪条法律法规。
- LLM技术,可以通过对话的方式进行合同起草与合同总结,既可以回答和检索更细节更完善的问题,也能在一个入口完成业务工作流的全部操作,降低使用成本,改变人机交互方式。
四、LLM在电子合同领域中的挑战
1. 高质量数据获取
AI输出高质量内容的前提在于高质量的数据,数据将成为法律科技领域中的壁垒之一。数据的质量越高,辐射的范围越广,AI在进行内容生成、合同审查以及提出法律建议时的准确率也会越高。
像LexisNexix-律商联讯一样,本身的业务形态就沉淀了大量的数据可供机器学习。LexisNexix,1970年成立的老牌法律研究服务公司,有超过160个国家、100多万律师和律所资源,50亿份卷宗,425万份审批书,32000多个法律与商业信息来源等海量数据(数据来源:维基百科)。
因为有这些数据积累,再基于基座模型微调后,推出Lexis AI的产品,在法律检索、合同总结、起草、审查等功能模块中,呈现了较高质量的效果。
2. 数据隐私问题
在电子合同领域中,用户对合同数据十分敏感。
大部分电子合同服务商提供的都是SaaS产品,数据存储在云端服务器中,将自己的合同数据存储在平台的服务器,或多或少都会担心数据的泄露问题。
目前解决这类问题的处理方式是:电子签约相关的功能在使用云端的产品能力,而签约后的合同文本,存储在客户本地。
但在使用合同审查、智能归档等功能时,平台都会要求客户将合同数据进行授权,只有同意授权后,才能使用相关的AI能力。这其实也等于将合同中的数据暴露给了平台。
所以大部分的AI产品应用,还停留在合同起草、法律研究、法律诉讼等不涉及合同数据的层面。
目前解决的方式有两种。
数据传输加密:
CoCounsel 在专用服务器上通过 API 的方式访问 OpenAI 的 GPT4 模型。所有数据在传输过程中都被加密。这意味着 OpenAI 无法查看数据进行模型训练。
同时用户始终保留对数据的控制权,可以在任何时候将其从平台上完全删除数据,但毕竟有一个将数据上传云端的过程,用户使用时依旧会有顾虑。
模型本地化部署:
将产品能力和模型能力本地化部署在客户的系统中,基于客户的行业数据,在客户的本地服务器中微调模型。这种方式收取的是定制费用,虽然能够一定程度解决客户的数据隐私问题,但是对于产品提供的企业来说,形成不了规模。
3. AI不会承担责任
对于LLM的“幻觉”问题,一直是该领域需要攻克的难题。虽然可以通过大量专业数据进行微调,通过强化学习的方式让输出的内容更安全、更合规,但是在细分的法律领域仍有可能出现幻觉。
目前AI能力的提供方,在提供AI能力时,都会进行免责声明。所以当AI生成幻觉的内容时,导致了起草的合同内容违规,或起诉的法律文本败诉,AI是不会承担任何责任的。
当下可行的解决方案是:建议产品的使用者,在使用AI产品能力时,需要在专业人士的监督下,对生成的内容进行核查后,再进行使用。
长期来看,对于法律科技公司而言,是否能够功克在法律细分领域中LLM的“幻觉”问题,是否能够承担因LLM的幻觉问题而导致的违规风险,也是竞争力体现的要素之一。
结尾
引用英国法律学者 Richard Susskind 的观点:律师事务所通过“拥有年轻的律师大军”而获利,因为他们向这些律师支付的工资低于他们向客户收取的费用。
LLM与电子合同的融合,最直接的影响体现体现在「降本增效」上。
To B:面向于企业内法务部门,提供协同起草、合同审查等效率工具,降低合同起草或合同文本中的法律风险,从而提升法务部人均效率。
通过归档履约工具,可提取合同中的价值信息,以可视化图表的方式呈现,智能提醒合同中履约和续约的时间节点及相关事项。
To C:个人或小微企业没有足够的资源聘用法律相关人才,且法律知识的学习成本高,若缺少法律相关的知识,则在合同签约时,对合同中的风险识别能力弱,会引起不必要的纠纷和权益的受损。
在AI技术的加持下,既能够在签约前通过AI审查合同中是否存在法律及权益的风险点,又能在出现合同违约时通过AI进行法律的维权服务,省时-省钱且高效。
好啦,以上是我对LLM与电子合同行业融合的阶段性理解。
如果文章中有描述不对的地方,请帮忙指正,避免对其他读者产生误导。
加油朋友们🤗
作者:在野在也,公众号:在野在也
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!