提供《数据资源目录规范》,《代码类标准规范》,《基础数据元标准规范(人口分册)》,《基础数据元标准规范(法人分册)》。
数据管控规范
提供《数据标准管理办法》,《数据质量管理办法》,《数据安全管理办法》,《数据隐私保护指南》,《数据资产管理办法》,《元数据管理办法》。
运营管理规范
提供《数据共享服务管理办法》,《数据采集管理办法》,《数据交换共享平台管理办法》。
数据中台性能目标
总体性能指标
- 基于分布式架构,具有很强的容错能力,错误恢复能力,错误记录及预警能力,具备异地容灾能力;
- 能支持同构、异构网络分布操作,支持松散耦合及海量并行处理;
- 提供稳定高效(7*24)的计算引擎,同时具备离线批计算和实时流式计算,满足海量数据处理和复杂逻辑运算以及实时反馈计算结果的需求;
- 系统支持从硬件层面,数据层面到业务层面高可用,满足系统可用性;
- 系统易于部署和扩展,支持版本迭代;
- 基于组件化和模块化的架构,支持与常用大数据组件无缝结合,满足用户自定义的需求;
- 系统在存储节点发生故障(硬盘损坏,网络抖动,机柜故障等),保持数据的完整性,或者提供数据完整恢复的能力;
- 具有完整的安全性(帐号安全,系统级权限,对象安全性,审查等),细粒度化的访问控制,适合于多层环境的安全模式的能力;
- 系统具备专业的认证体系和数据访问机制,保障数据安全;
- 确保系统具有高度的安全性,提供安全的登录和访问措施,防止系统被攻击;
- 支持上千级任务并发调度运行;
- 数据规模-能够处理数据规模PB级以上的数据;
- 文件规模-能够处理百万规模以上的文件数量;
- 节点规模-能够处理1000节点以上的规模。
计算资源性能指标
数据接入性能指标
- 单工作节点的处理能力要求达到 30 MB/s;
- 单工作节点的处理能力要求达到 30000Records/s;
- 支持集群部署,性能随集群节点扩充性能近线性提升;
- 支持不低于100个数据并发链路,正常50个并发链路的性能;
离线计算性能指标
- 亿级单表查询秒级左右响应时间,亿级表关联操作不超过10秒;
- 支持超过1000的任务并发,任务丢失率小于等于千分之一;
实时计算性能指标
- 单数据节点QPS超过1000,并且可通过简单增加节点数量的方式进行水平无缝扩展,并在分布式架构下多节点集群QPS可达百万级;
- 源数据导入系统的响应延迟在秒级以内,数据计算处理的延迟在秒级以内;
- 实时流处理支持最大50万目标,时延不大于5秒;
- 局部节点故障分钟级自动恢复并对用户透明。
共享开放性能指标
- 数据共享与业务协同
- 支持关系型数据和非关系型数据,文件型支持各种文本文件,关系数据库支持 Oracle、DB2、MySQL、SQLServer、达梦、金仓、神通等国内外主流数据库,支持 MongoDB、Hbase、Redis等非关系型数据库;
- 数据共享机构数 300个;
- 每次数据交换,1MB以内的文件域内用时 3秒,省、市跨域数据交换用时 5 秒;
- 交换节点可扩展,不影响当前业务的运行。
- 数据开放
- 支持进行公共数据的开放及数据存储;
- 最小支持 5000 系统用户同时在线访问,最小支持 2000 个用户并发;
- 用户检索单条数据响应时间 3 秒。