隐私计算商业模型的九块拼图
隐私计算作为近几年火起来的新生事物,因涉及到多个参与方之间要建立商业连接,既要做到技术是安全和可靠的,还要通过各种合规性的检验,因此,隐私计算在实际落地时大多数情况下并不顺利。
窃以为,做成一个隐私计算项目跟孩子们玩乐高拼图是极其相似的,一个完整的隐私计算商业模型拼图需要完成九个小版块的拼接,这里我把这种说法总结为隐私计算商业模型的“九块拼图”理论。
01 监管拼图
现阶段监管政策是隐私计算最直接的驱动力。近几年,国家在个人信息保护方面的政策法规处于密集出台的状态,合规化、严格化、严厉化将是主流,而且国家对于数据的监管只会越来越严,数据合规使用将是一种新常态。
央行在去年底也发布了金融行业进行数据安全共享的通知,并下发了隐私计算的相关技术规范,这也预示着金融行业采用隐私计算的方式采购外部数据服务将是一种新的必然趋势,合规则生、不合规则死,只有按照监管政策的精神和要求来做,才能在激烈的市场竞争中继续前行。
在监管部门的推动下,业内机构看“天”做事。有了监管部门的令箭,业内机构才会名正言顺的去落实,隐私计算才会正大光明的进入议事日程。作为数据源和对数据有刚需的客户来说,只有积极拥抱隐私计算才能满足行业监管政策的要求,这是大势所趋、人心所向。
02 内审拼图
仅仅靠监管部门的指导意见或一纸公文,还不足以让市场真正动起来。因为,还需要机构客户内部一个很重要的部门的认同,那就是法务或内审部门。法务和内审部门在这里统称为内部的合规监管部门,他们对隐私计算能否落地有很大的影响力。
由于隐私计算仅从技术角度解决了数据跨界合规使用的问题,解决了数据使用权的问题,但没有完全解决用户授权问题。隐私计算本身作为技术中立的合法性尚无专门的法律给出明确的认可性说明。
当企业内部合规监管部门对隐私计算持犹豫或观望态度时,业务部门推动隐私计算就会面临较大的阻力。要想通过合规监管部门审计这一关,业务部门还需要多下功夫广泛举证,毕竟隐私计算的解释成本本来就很高。
03 价值拼图
隐私计算的价值拼图至少包括两个方面,其一是数据价值,其二是隐私计算的价值。
数据价值指的是,业务需求方知道数据源方有哪些数据,哪些数据对自己是有价值的。达成这个基本共识是双方开展合作的前提,否则就是乱点鸳鸯谱,可能起到反作用。
数据往往是牵引隐私计算落地的利器,当数据源侧以隐私计算输出服务时,业务方要想引入它们的数据服务就必须引入隐私计算。数据跨界融合是隐私计算要承载的内容,隐私计算的目标是要实现数据价值的安全流通,数据可用不可见,要价值不要原始数据,这是隐私计算的初心。
隐私计算的价值指的是隐私保护计算的技术体系在哪些方面发挥作用。
也就是说,隐私计算的方式与之前的方式有何不同,保护了什么,保护了谁的数据隐私,带来了哪些改变或增益,而且这些价值能在商业上成为一种可持续的业务模式。这些都是体现隐私计算价值的地方,也是业务方愿意买单的理由。
04 场景拼图
隐私计算作为跨机构实现安全连接的桥梁,最终还是要为业务服务,要在到合适的业务场景中找到其应用价值。场景拼图的目标就是要找到合适的引爆点。
说到隐私计算适配的业务场景,要有一个基本的判断标准。一般来说,隐私计算适合于跨机构的数据连接,业务方有引入外部数据的需求,数据源侧有对外数据价值变现的需求。具体来说,业务方可以用外部数据更合规的满足查询、统计和建模等方面的需求。
关于隐私计算与业务场景的匹配度,笔者之前提出了一个SICH评估模型,篇幅关系,今天不详细展开了。有兴趣的读者可留言探讨。
05 授权拼图
隐私计算主要解决的是计算层面的安全问题,但不一定能解决数据授权的问题。在实际应用场景下,用户的数据授权也很关键,这也是企业内部合规监管部门比较关注的内容。
授权拼图是完成隐私计算版图的重要环节。授权不全,合作难产。授权不通,落地成空。在金融行业,用户向金融机构申请贷款时,通常需要授权金融机构查询其在多个数据源的背景信息,这个是隐私计算落地最普遍的风控类场景,用户授权是比较容易获得的。
但非风控类场景下,要想取得用户授权并非易事,用户凭什么要授权业务方去查询与业务方毫不相干的数据呢?
所以,很多业务方想用隐私计算的方式来解决营销类场景下的标签补全或样本扩充的问题,往往都是在YY。所以,我要提醒的是,请先看看有无用户授权,不要做无用功。没有用户授权,最好的隐私计算都是空中楼阁。
06 商务拼图
隐私计算项目就是要大家组网一起玩,如果参与各方原来就很熟悉,那就更容易建立合作关系。如果业务方和数据源原来并没有合作过或者彼此不熟悉,那么,就需要隐私计算技术厂商在其中牵线搭桥,把大家撺在一起,建立一个小的商业联邦。
隐私计算说到底是个工具,能把数据源和业务方连接起来的是商业利益。商业就是如此的现实,没有利益凭什么要求别人跟你一起玩呢?所以,在商务基础上建立连接,完成商务拼图,基于应用场景衍生出的商业利益进行合作是隐私计算项目落地的关键抓手。
07 技术拼图
技术是隐私计算落地的重要拼图之一。目前联邦学习、多方安全计算、TEE(Trusted Execution Environment)等是比较通用的跨机构融合计算方式,在技术上已经被证明是相对更安全的了。
联邦学习是一种加密的分布式机器学习技术,允许各参与方在本地设备对自有数据进行模型训练,并仅将模型训练的迭代更新成果加密上传至云端,通过与云端其它参与者的模型更新成果相融合,对联合模型进行改进并反馈给各参与者。
该框架可在各参与者不揭露底层数据的前提下,共同建立与改进机器学习模型,从而缓解传统机器学习中数据离开本地带来的数据隐私与合规问题。
多方安全计算是在保证参与方隐私数据安全的前提下,让多个数据所有者在联合的数据上进行协同计算以提取数据价值,且不泄露每个数据所有者的原始数据,最终实现数据的所有权和数据使用权相互分离,使数据“可用而不可见”,并控制数据的用途和用量。
可信执行环境(TEE)提供一个隔离的执行环境,提供的安全特征包含:隔离执行、可信应用的完整性、可信数据的机密性、安全存储等。主要思路是在计算机硬件平台上引入安全芯片架构,通过提供的安全特性来提高终端系统的安全性。TEE是一种数据安全和隐私保护的硬件实现方式。
无论是哪种技术实现方式,都需要从认证授权、密码安全、隐私数据安全、存证与日志等方面保障计算的安全性。隐私计算技术厂商往往需要自证清白,所以,需要请相关监管机构做测评与认证,有公安部一所等部门的权威认证做为背书,让行业客户放心和安心使用。
08 互通拼图
目前,隐私计算有多种技术实现路径。
比如:密码学路径,联邦学习路径和TEE方式。隐私计算本身是为了解决跨机构的数据不通问题的,隐私计算技术与产品自身不应该成为数据互联互通的新的阻碍。一枝花开不是春,百花齐放春满园。
小的联邦之内实现了互联互通固然好,但全面畅通、生态级互通才能造就产业繁荣。所以,不同的隐私计算技术应该实现互联互通,也有义务去互联互通。妄图以隐私计算技术打造一个垄断的、封闭的数据联盟都是逆势而为,长远来看,必将会被市场抛弃。
当然,实现异构系统之间的互联互通殊非易事。需要行业监管部门建立互联互通的技术标准和规范,引导从业机构从协议层、通信层等自底向上逐级去做打通。互联互通这件事情是必须要去做的,是隐私计算技术厂商的共同拼图。
09 效率拼图
隐私计算最终能否在实际生产中落地,还与密文计算的性能息息相关。
打个比方,甲乙两座城市隔海相望而不得通,同样是实现了两座城市的连接,用独木桥的方式与高速公路的方式那是有天壤之别的。隐私计算也是类似的道理,低效率的连接与计算一般无法满足大规模商用的要求。提高密文计算的效率,是隐私计算无法回避的话题。
完成效率拼图是隐私计算大规模商用的临门一脚。当密文计算与明文计算一样快时,明文计算也就基本上可以退出历史舞台了。
提升密文计算的算力有多种解决方案。在软件层面可以优化机器学习算法,优化加密算法;在硬件方面,可以开发基于CPU和GPU的加速方案,将来甚至开发出PPU(PPU, Privacy Preserving Unit )。
GPU加速的终极目标是隐私保护计算芯片,将来PPU芯片里的指令完全用于加解密运算,PPU芯片中一个clock就能完成CPU上100万个clock的运算,将实现算力的指数级增长。
最后,小结一下:
- 隐私计算将重构数据生态。隐私计算前景广阔,但道路是曲折的;
- 隐私计算的商业模型落地不光需要天时地利人和,还需要完成9个拼图;
- 用旧船票找不到新大陆。道远且长,隐私计算落地需要新模式、新商业。
#作者#
黄小刚,微信公众号:大数据产品设计与运营。拥有超过10年的BI应用咨询与解决方案实战经验、5年大数据产品设计与管理经验。一个非主流的大数据应用专家,一个非著名的数据产品经理。
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!