网易数帆大数据数据治理2.0
1. 为什么数据治理项目经常失败?
- 数据开发与数据治理脱节:数据质量与数据开发脱节,数据标准与数据建模脱节,数据标准与数据安全脱节,任务无法按照资产等级进行有效管理。
- 缺乏统一管理:不同计算、存储引擎增加用户找数据、理解数据、用数据的成本。
- 忽视开发过程中的效率与质量问题:数据开发任务及配置导致65%的数据问题,数据开发任务变更导致的生产环境数据问题占比达65%。
- 烟囱式的数据开发:指标口径不一致,数据重复开发,数据重复计算。
- 数据价值和成本评估不足:大量数据和报表无人使用,浪费存储和计算资源。
- 缺乏量化与持续反馈的闭环:数据质量、数据安全、数据价值、数据成本缺乏量化手段和持续反馈。
2. 网易数帆数据治理2.0
- 核心亮点:开发与治理一体化,逻辑数据湖,DataOps 数据开发底座,数据中台架构,基于 ROI 的数据资产化。
- 数据开发与治理一体化:通过数据探查生成值域约束,数据标准绑定稽核规则,自动添加到表的稽核监控。
- 基于 DataFabric 的逻辑数据湖:元数据注册、采集、扫描、发布,业务过程模型设计,维度度量。
- 基于 DataOps 的数据开发底座:编码测试编排,代码审查发布,智能任务依赖推荐,参数组,智能诊断,自动化回归,全链路影响分析。
3. 实践案例
- 某大型运营商:
- 背景:数据标准、数据质量与数据开发严重脱节,不同厂商工具割裂。
- 解决方案:引入网易数帆一站式工具平台,实现数据开发与治理一体化。
- 成果:
- 质量问题下降63%
- 稽核规则覆盖率达到92%
- 数据使用用户规模从30+扩展到500+
- 平均需求交付时间从一周提升到3天
- 下线无用数据20%,年约节省成本超过100万元
结语
通过数据治理2.0,网易数帆实现了数据开发与治理的一体化,提升了数据质量和使用效率,降低了成本,为企业带来了显著的价值。