数据运营:构建数据应用网络与算法平台
作者:侯宏
(一)引言
在 《传统软件企业转型路径:理论、案例与讨论》 一文中,我们探讨过项目与运营的区别,其中有一条是
运营是相对开放的系统,项目是相对封闭的系统
同时,我们还认为运营实际上对软件企业意味着平台化机遇,是对网络效应的追寻,与产品化对零边际成本的追寻遥相呼应。
以东软熙康和用友易代账的案例,我们说明软件产业的下列转变:
- 市场类型从单边到双边
- 软件企业的角色从乙方到平台方
- 软件的角色从内部功能到交易&互动的场所
这篇文章我们探讨普遍而抽象的运营:数据运营
软件,尤其是应用软件,一直源源不断地产生数据,而把数据作为运营重心可能短期内并不为所有人接受。但实际上,数据可以为软件(应用)企业平台化提供一种普遍路径和共性逻辑,值得更深刻地认识。
两个图两个视角,下面分开阐述
(二)算法即平台
算法是平台,数据和应用是双边客户。
数据和应用之间是相互促进的正反馈。一方面,应用部署得越广泛或运行时间越长,搜集的数据就越丰富;另一方面,数据越丰富,应用价值就越凸显。
一个著名的例子是Google。 Google的搜索引擎(应用)由于份额较高,用户行为不断转化为数据优化其算法,这样确保搜索效率和效度较高,从而用户更愿意使用。这样的正反馈下,竞争对手很难超越。
但更一般地,产生数据的和使用应用的并不完全重叠,也就是说需要外界输入数据到应用,应用才能创造价值。
- 比如,腾讯向政府和企业客户推广的位置信息应用,其数据来自QQ用户的位置数据,而应用价值体现为交通优化、公共安全等
- 再比如,社保部门或保险公司使用的医疗反欺诈应用,其数据需要来自医院内部HIS系统产生的电子病历等数据
在这种情况下,数据与应用是两个独立要素,之间存在正反馈:
- 数据能够增进应用价值。若应用不仅获得QQ数据,还包括电信信令数据以及城建、交管部门的内部数据,对于交通规划的应用价值将更大。
- 应用能够促进数据搜集。为控制医保支出,预防性干预和医疗欺诈的应用诉求变强,电子健康档案得到高度重视和广泛部署,从而扩充了数据
这个正反馈的成立,依赖于算法:数据是自变量,应用价值是因变量,则函数和反函数都是算法:
- 算法帮助数据转化为应用价值。单一数据源的应用价值不如多元数据的应用价值,核心就在于后者的算法能够从不同的数据来源中提取应用目标更全面的属性、获得更精准的洞察。算法实际上是人类知识的建模,结果的优化不仅在于输入数据的增加,更在于模型能有效分析利用这些数据
- 算法帮助应用定义并争取数据来源。算法实验可以发现一些特定数据在特定应用场景下的价值,比如疾病预测算法可能要求电子健康档案搜集一些新的数据。正由于该算法能转化这些数据的价值,在争取该数据源支持的方面,算法的份量甚至会大于应用的份量
人工智能对软件企业转型为何重要?它不是算法本身但它是算法引擎,是算法平台的底座/基础设施,能够更高效地、甚至自发地从数据中涌现出知识。如果数据和应用都是可扩展的话,人工智能便成了算法平台竞争的决定性因素之一。
(三)算法即链接
以应用和数据为节点,算法为链接构成数据价值网络。
链接有强弱之分- 强链接是基于特定应用与特定数据的强互补性,如医疗应用与医疗数据,公安应用与公安数据,电信应用与电信数据。弱链接是基于数据的跨界价值,比如电信数据之于公安应用,医疗数据之与保险应用。
链接有单向双向之分- 上述强链接都是双向的,应用是数据的来源,数据是应用的基础;弱链接都是单向的,电信数据会提升公安应用价值,但公安应用价值不会带来更多的电信数据。
并不是强链接一定比弱链接重要。格兰诺维特(弱连接理论的提出者)已经说明了弱链接的强力量,在数据运营中这一点其实也非常明显。考虑到差异化竞争的需要,强链接是基础,弱链接却是制胜奇兵。
双向链接也并不一定比单向链接重要。 有时必须借助单向链接建立双向链接。比如某数据和某应用是双向链接,但由于某数据不开放,某应用一直没有机会证明其价值。如果通过单向链接引入外部开放数据初步证明了上述应用价值,转而可以推动上述数据开放,有助于形成双向链接
链接的实质是算法,离开了算法,数据和应用无法自行“思考”是否形成链接。换而言之,无论是弱链接还是强链接,单向链接还是双向链接,这些关系都存储在算法中。
如果存在一个算法平台,它将是这些链接最大的得益者。如果把数据的世界比喻成互联网,算法平台就是路由器。
数据与数据之间的链接?No Way!
数据具有外部性、多歧性,但本身是不带有目的性和主动性。数据与数据不会自然发生化学反应/链接,我们看到的化学反应都是应用和算法加入后的结果。
在模型中可以看到:不同数据间并无直接链接,但借道应用对不同数据源的吸纳能力,形成间接链接。我过去一直鼓吹数据与数据之间的网络效应,上述模型做出了反思和修正。
(四)数据运营与算法平台
数据运营是对数据、算法、应用三大要素以价值为导向的持续性商业活动。它包括强链接的运营和弱链接的拓展,最终形成一张致密的网络。
第一阶段的强链接运营, 是应用和数据的一体化,应用是数据的应用,数据是应用的数据。
第二阶段的弱链接拓展分为两方面, 一是上一阶段积累的数据开始向其他应用输出,二是为上一阶段的应用寻找新的数据源。
第三阶段对外部节点(数据/应用)开放链接能力。
可见,数据运营不等于运营数据,应用可能是更重要的。但为何不称其为应用运营呢?是因为要与传统的Saas运营区别开来,充分发挥数据应用的特性。
在上述过程中,算法平台逐步构建。
最初它就是一个或几个强链接的算法,并不能称为平台,甚至也并不一定需要人工智能,专家知识即可胜任。
但随着数据应用网络的扩大,机器学习的能力是必备的,这种能力及专家模型积累到一定程度可以对外开放,加速平台能力的沉淀。
是的,Waston就是一种算法平台。
End.
关键字:算法, 产品运营, 产品经理
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!