(2) 建立组织
数据治理永远在路上,需要依据数据治理战略的要求,制定数据治理的远期和近期目标,建立组织架构科学(例如,数据治理委员会、数据治理工作组、数据管理员 /IT 技术人员三层架构)、人员分工明确(包括岗位、角色、人员和职责等)的数据治理团队以保障企业数据治理战略的实现。
制定统一的数据标准和规范,开发共用的、标准的数据集成原则,定义企业级的数据逻辑模型,为实现企业的数据集成、数据共享、业务协同和数据交换做好数据保障。制定科学的度量指标对数据的质量、治理活动的质量进行度量和跟踪,保障数据治理战略的实现。
(3)执行活动
为做好数据治理工作,首先需要根据治理目标的不同制定任务分解计划、时间执行计划、资源调度计划、沟通协调计划、成本控制计划、质量保障计划、安全审计计划和风险防范计划等治理活动执行的计划。
数据治理的计划制定完成之后,需要按照计划开展数据治理活动,按照要求完成计划中的每一项任务。执行数据治理活动就是执行各个功能域的治理活动。各个功能域的目标、原则必须与大数据治理的总体目标、原则一致。功能域的活动就是完成数据治理的每一项任务。
(4) 监控反馈
数据治理活动执行之后会输出治理成果,该成果可能是一个中间结果,也可能是一个里程碑成果,甚至可能是正式提交的成果。无论何种类型的成果,都需要对其进行科学的评估,评估的原则主要包括:成果是否满足任务计划要求,比如:安全要求、质量要求等等;成果是否符合数据治理需求的预期;治理成果是否被利益相关者所认可和接受。
治理成果经过评估之后,可能会发现一些需要改进的地方,例如成果与需求预期的差异,治理成果存在质量方面的欠缺等等。这些需要改进的地方需要重新列入计划,继续投入相关的资源进行完善和治理。治理过程不是一次性的工作,是不断的迭代进行的,所以需要遵循 PDCA 循环。
五、数据治理的能力评估
数据管理成熟度是指企业按照数据治理的目标和条件,成功、可靠、持续地实施数据管理的能力。通过数据管理成熟度模型可对企业数据管理能力进行量化评价,给出企业数据管理能力的水平评价。数据治理的能力评价着重要考虑模型选取、评估实施和持续优化三个方面。
(1) 模型选取
从国际上看,常用的模型主要有:2008 年 Gartner发布的《企业信息管理成熟度模型》,2010 年 IBM发布的《IBM数据治理统一流程》,2014年CMMi 协会发布的《数据管理能力成熟度模型》,2015 年发布的《数据管理能力评估模型》。
从国内看,国标委于2018年发布了我国首个数据管理领域国家标准《数据管理能力成熟度评估模型》。该标准由全国信标委大数据标准工作组编制,借鉴了国内外数据管理成熟度相关理论思想,融合了我国大数据发展的特色与趋势,结合了数据生命周期管理各个阶段的特征。通过该模型,企业可以清楚的定义数据当前所处的发展阶段以及未来发展方向。