浅谈数字化转型中的数据展现、分析和合规问题
编辑导语:2021年是数据隐私保护的元年,这一年以来,隐私的保护受到了重视。企业在数字化转型中也应当注重隐私数据是否合乎规定,不泄露他人信息。本文列举了几个案例,分析数据对产品的价值以及我们需要明确的问题。
一、从“数据驾驶舱”和“大屏”谈起
不知道是不是电动汽车在国内更普及的原因,越来越多的国内项目招标的时候,都模拟电动车的设计,规划了“数据驾驶舱”或者“大屏”的需求。令人寻味的是,这种项目里最贵的不是软件,而是硬件,是LED的屏幕(各位不了解行情的,可以自行翻一翻相关材料)。
可想而知,LED屏幕或者驾驶舱是需要一个至少几百平的大汇报厅去布置。软件里最贵的,不是SQL语句,而是UI设计。我能够理解“数据驾驶舱”和“大屏”在数字化转型过程中,门面的地位和作用。在这里,“UI设计”实际上应该称为“室内设计”,需要和大厅的装潢相适应。
我并不是在吐槽,因为确实这个场馆正常也要安装LED屏幕,不算是浪费。但这种趋势实际上是代表了硬件项目,由软件厂商做总集成的现实。这种现实的背后,是经营主体更加重视数据化转型,数据在业务经营中的重要性的地位在不断地提高。
往下再探一层,其实我们会发现,数字化转型在国内,仍然处在一个非常初级的阶段。这个表现就是经营主体花了大量的成本在“数据驾驶舱”和“大屏”,错误的把“数据展现层”的应用当成了“数据决策层”的应用。
我讲得更直白一点,业务决策根本不需要“数据驾驶舱”和“大屏”。
二、“中国式报表”的隐忧
除了“数据驾驶舱”和“大屏”,还有一个很有意思的设计是“中国式报表”。就是你不能说这个BI没用,你只能说这种报表让数据更华丽了。但数据就是数据,从来没有人会认为穿着“高级定制”的数据质量更好。
“中国式报表”呈现了一种冗余设计,核心表现是表格复杂,信息量大,表头混乱。为了做表而做一张表,是不是很像为了加班而加班的我们?
“中国式报表”的问题在于,缺少对问题的预判和分析结论。就好像写论文,没写开题报告、论点和结论,只有论证。大而全的报表内容,承认了繁重的工作量,但却不解决问题。
很多和数据有关的产品,成了“呈现原始数据”的产品,而不是“聚焦+决策”的产品。这也是经营主体,在在数字化转型中,数据中心“建了不如不建”的原因所在。
三、实现数据aPaaS能力的美好愿望
夯实数据能力的关键,是快速“聚焦+决策”问题。于是,有人想到在报表的能力上,增加“数据模板”和“实时报表”两个模块,这是很多自助型报表工具诞生的原因。
把复杂问题聚焦在几张主题报表上,只关心和主题相关的数据,把中国式报表作为数据源,通过“托拉拽”完成数据的可持续化的运营。这里面产品售卖的就不仅仅是数据采集和加工,同时也看产品方对行业数据的理解能力。
让客户主动“托拉拽”可能是一个美好的愿望,这种产品教育,可不是打打字就能很快完成的。aPaaS的模式可能还要很长一段时间,才能成为主要选项被大家认可。业务方需要定制化产品的情况,还会持续。
总之,在产品初期阶段,我想至少应该有简单主题数据模板的能力,这种产品才能商业化。
四、描述数据质量的三个维度
从BI分析像技术底层部分观察,“大数据计算”这个词已经被售前们用烂了,各个公司张口闭口就是大数据计算和人工智能,殊不知产品只有几个核心读写库,技术水平、运营能力都难上桌面。
大数据最基本的衡量指标应该是数据量、准确性和实时性。数据量是处理能力,数据库级别的处理能力,和数据集群分库分表的难度是不一样的,这是第一个难度级。
准确性是指数据采集和清洗的能力,这个能力可能是和RPA技术相关,可能是和IoT技术相关,也可能是和接口标准的组织能力相关,这是第二个难度级。
最后,实时性是反应在数据实时计算、实时查询的能力。分析型数据库的性能、成本控制、数据结构的设计是第三个难度级。
数据的质量是数据分析的基础,“大数据计算”能力虽然不懂行的人不会深究,但是对照看来,很多厂商其实都“挂羊头卖狗肉”。能力就处在数据库的存取+筛选排序的程度。很难说这样的公司具备大数据解决方案的能力。
五、“接口费”和产品化的矛盾
另一个经常遇到的问题是,有一些行业有“接口费”这一说,基本上是负责核心业务服务商的遗留问题。
有的项目里,数据源的对接是很大一块成本。我见过一个老的核心产品的核心收入就全部都是接口费。对于这种额外成本,目前这个阶段很难避免,新的下游的业务完全依赖产生数据的核心业务系统,而核心业务系统基本上是被业务厂家绑架的状态,换也换不掉,也无法顺利升级,就是一个接一个的收“接口费”。
在之前的文章里,有讲到产品要做到业务的上游和下游去,在数据源上,也要争取数据源的上游和下游的拓展。核心业务系统,就是核心产生数据,数据量最大的业务。“接口费”和产品化的矛盾可能只有在核心业务被其他业务系统蚕食的那一天,才能避免。
六、产品不提供算法到底行不行
数据量在时间的统计尺度下,积累3~5年才可能会有算法的需求。所以时间尺度下,数据没有积累,是基本上不用考虑依靠算法去提高产品竞争力的。
在有了3~5年历史数据积累的情况下,还要再判断这个业务算法,解决的是存量问题还是增量问题。存量问题就是和过去3~5年变量一致的样本数据,增量问题就是需要依靠新的变量做预测的业务。算法很难对增量问题测得准,需要依靠关键岗位的关键判断,才能准确产出。
所以产品可以有算法,但没必要过分关注算法,有时候程序和流程的优化效果会远远大于算法带来的价值。
七、2021年是数据隐私保护元年
从数据呈现、决策,讲到数据技术和算法,最后这部分是数据采集的合规性。2021年我会把这一年定义成“数据隐私保护”的元年。《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》两个重要法规,均在2021年正式生效。
凡是和数据沾边的开发者,都应该守好数据合规的底线,数据保护是开发者、业务方、使用者共担责任,任何人不能以任何理由,在当事人未经许可的情况下,擅自收集或泄露私密数据。
目前听到很多“多邦安全计算”、“隐私计算”等等技术,都没有很明确的合规定义。建议所有数据产品开发者,审慎看待数据业务,在法律允许的范围内开展业务,不漠视数据安全的风险,一丝不苟做好数据安全“等保”
八、写在最后
定义好客户是产品价值的原动力,明确你的客户是谁很重要,明确你的客户的客户是谁,更重要。
作者
稀奇先生,公众号:稀奇星球,拥有十余种标准化产品规划经验,7年TO G业务老兵、智能化解决方案产品专家。
题图来自Unsplash,基于CC0
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!