搭建数据资产管理平台之实施流程
一、数据资产管理平台如何搭建?
该篇文章简述数据资产管理平台搭建的内容、流程和注意事项。
自研or采购
实现数据资产管理平台可以分为两种方式,自研或采购,这两者之间的区别也是非常明显。
先说采购,采购一般是商业化的数据治理套件,其中的数据资产管理相关的数据目录、数据标准、数据血缘、数据质量等内容很难单独购买。
一般都是,为了买一个工具,要买一整套的数据治理服务。这意味着要付出多余的成本。
但是对于刚刚步入大数据业务范畴的公司,尤其是传统企业,对数据仓库,数据资产,数据治理认知不足的情况下,更适合通过直接采购成熟的数据开发、治理套件去使用。
可以提高数据团队的认知,规范数据团队的开发流程。
其次是自研数据资产管理平台,适合已经建设完成数据仓库且有足够资源的企业,自研能够更好的服务企业内部用户,提供定制化的产品能力。
项目实施流程:需求识别–可行性分析–需求规格确定–项目规划–系统开发–项目实施–项目验收几个关键阶段。
二、需求识别
想要启动数据资产管理平台项目,首先要明确企业的当前阶段是否需要该产品,是否必须通过上线该产品来解决某些问题,达到企业目标。
数据资产管理就是对元数据进行管理,是数据治理的基础。不只是数据的增删改查,而是和维度建模、数据标准、数据安全、数据质量息息相关的。
比如在数仓不同层级表元模型各不相同,不同实体的元模型各不相同。
比如在元数据管理过程中,部分元数据枚举值的来源已制定的数据标准。
比如上下游表之间数据的安全等级关系。
比如对于各个实体而言, 数据质量检测结果也是元数据的一种。
所以在实施数据资产管理前,甚至是需求收集前,不妨先了解当前的数据建设情况,组织流程是否完善,数据规范/数据标准维护是否完善,线下文件是否有合理管理方法,并了解当前管理的方法还存在哪些问题。
其次考虑当前阶段是否需要考虑数据安全,数据质量等内容。
最终确定当前阶段开发数据资产管理平台的必要性,平台的能力范围。
可以询问以下几个问题:
- 在开发平台之前,是如何管理元数据的?
- 当前数据管理的组织,流程,规范,标准建设阶段是怎么样的?
- 出现的数据管理问题是流程问题,规范问题,模型问题,还是资源问题?
- 当前有多少条业务线在生产数据,生产的量级大概是多少?(业务线多代表管理难度大)
三、可行性分析
现状分析:主要包括数据建设现状分析、数据应用情况、数据集成情况。
建设边界:哪些系统需要数据资产管理平台的支持,比如除了数据仓库的元数据采集,还可以链接BI工具/数据服务的元数据及血缘关系。
建设质量:主要是看企业当前数据仓库,数据标准,数据安全的建设情况;当前的元数据管理方式,存储方式,通过什么方式可以保证线上管理的准确性和及时性。这关系着系统上线后的易用性,以及元数据的质量。
建设成本:采购成本/自研成本。
项目目标:描述本项业务达成目标,如发挥的作用、解决的问题、对基层的支撑、体现的价值,原则上需要有可量化、可评估目标。
四、需求规格确定
1. 元数据采集
确定元数据的采集范围,元数据模型,包括业务元数据、技术元数据、管理元数据等;确定采集方式、采集频率、存储方式。
注意采集边界,哪些元数据可直接采到,哪些元数据需要手动维护,哪些自动采集配合手动维护。
手动维护元数据是一项长期,工作量较大的工作,所以不能自动采集的元数据,通过什么方式可以自动采集也是未来需要考虑的地方。
2. 数据目录
为了快速的查看数据资产情况,需要对数据资产进行盘点,可以从主题域、数仓分层、数据来源,或自定义目录等角度盘点数据资产的数量。
支持数据资产查询,数据资产详情,元数据管理等功能。
3. 数据血缘
数据血缘也是元数据的一种展现形式,主要运用于影响分析、问题归因、数据价值评估、数据安全分析等。
4. 数据质量
数据质量监控DQC模块,是处于被动式数据治理阶段,即对运行结果的监测,按照数据资产等级划分-检测任务配置-运行结果预警/通知的流程,保障数据完整性、一致性、准确性等。
五、项目规划
建设规划:数据资产管理平台,并非一次性可以建设完成。
大致可分为基础元数据展示阶段、提高元数据管理能力阶段,促进数据应用与共享三个阶段进行系统开发实施。
项目开始前制定每个阶段的产品目标,每个阶段要做成什么样,基于这样的方向,列出非常详细的计划,包括资源的规划,每个里程碑的时间节点,输出物,成果的评价方式等。
本文作者 @清小墨
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!