华为数字化转型与数据管理实践介绍 SecurityLevel: 华为数据工作的两个阶段:第一阶段通过数据治理、业务数字化、数据流打通提升业务作业效率和质量;第二阶段通过建设数据底座、汇聚联接数据、数据服务化,支持数字化运营 清洁数据成就卓越运营,智慧数据驱动有效增长 数据工作的两个阶段数据价值管理诉求 数据分析与洞察 业务可视,使能快速、准确决策 •通过数据汇聚,实现业务状态透明可视,提供基于 第“事实”的决策支持依据。 阶 二人工智能,实现业务自动化 段•通过业务规则数字化、算法化,嵌入业务流,逐步替 代人工判断。 数据创新,成为差异化竞争优势 •基于数据的用户洞察,发现新的市场机会点。 数据清洁与贯通 第数据全流程贯通,提升业务运作效率 —•通过业务数字化、标准化,借助IT技术,实现业务上下 阶游信息快速传递、共享 段数据质量持续提升,减少纠错成本 •通过数据质量度量与持续改进,确保数据真实反应业 务(“帐实”一致),降低运营风险。 跨领域数据汇聚与整合 自助式数据获取与分析 差异化的信息安全保护 一致的信息架构与标准 唯一可信的数据源 有效的质量度量改进机制 建立完善的“数据管理体系”:明确数据管理的政策、流程、组织、IT等组件,并通过完 数据是企业的战略资产 整的数据管理体系的运作,不断促进业务规则和流程的优化,支撑数据打通和数据清洁目标的实现 政策 指引 数据架构管理政策 公司数据管理总纲 数据质量管理政策 数据源管理政策 基于主业务流的信息价值链综合治理(数据&流程&IT):纵横打通+数据清洁 维 主数据在交易打通 战略到执行信息价值链 业务交易到核算信息价值链 产品创意到生命周期管理信息价值链存量管理到问题解决信息价值链 度数据在报告打通 流程管理数据架构管理数据质量管理数据分析 数据架构管理 数据质量管理 组织 公司数据Owner 数据管理部 信息架构专家组 IT 主数据管理平台 维度数据管理平台 元数据管理平台 数据质量管理工具 健全了公司数据管理组织:各领域/BG分别建立了实体化的数据管理组织(专业的数据管 家),虚线向公司数据管理部汇报;同时组建6个跨领域数据联合工作团队 体系建设者 能力中心 数据管理 组织定位 业务的数据伙伴 文化倡导者 公司数据Owner 质量与流程IT管理部 领域数据Owner 公司数据管理部 质量运营部/XX管理部 XX 数据管理部 XX 数据管理部 XX 数据管理部 XX 数据管理部 XX 数据管理部 XX 数据管理部 XX 数据管理部 XX 数据管理部 XX 数据管理部 XX 数据管理部 XX 数据管理部 跨领域数据联合工作组 数据质量执行组 数据架构建设组 数据服务推进组 数据分析工作组 数据底座工作组 元数据工作组 开发了“管理数据”流程:1个L2、3个L3 12.0MBT&IT L1 12.5管理数据 L2 12.5.3管理数据分析 12.5.2管理数据质量 12.5.1管理数据架构 L3 发布了公司数据管理政策 数据管理政策是数据管理的“基本法”,从目的、适用范围、管理原则、问责等方面进行规定,是公司层面需要遵从的文件。 1.数据管理总纲 •数据是公司核心资产,数据准确是有效内控的基础。 2.数据架构管理政策 •规定数据架构、数据产生、数据应用、数据问责与奖惩的基本原则。 •数据架构是公司统一的数据语言,是业务流打通、消除信息孤岛和提升业务流集成效率的关键要素。 3.数据源管理政策 •规定数据架构的角色与职责、建设要求、遵从管控。 •确保数据源头的统一,以及跨流程、跨系统数据的唯一性和一致性。 •明确数据在创建、维护及应用过程中的规则及质量要求。 4.数据质量管理政策 •数据源管理原则与认证标准。 建立数据管控与运作模型:通过变革管理体系、流程运营体系运作落地 质量运营团队 业务运作团队 变革管理办公室PO 企业架构委员会EAC 各业务领域 变革指导委员会ESC公司数据 Owner 全球流程责任人GPOs 业务架构专家组 数据架构专家组 应用架构专家组 技术架构专家组 数据管家 业务变革项目 变革管理体系 业务优化/数据攻关团队 流程运营体系 华为ESC决议【2014】002号-关于变革指导委员会运作机制的决议http://w3.huawei.com/info/cn/doc/viewDoc.do?did=5533581&cata=376391 概念数据模型 确定了四大信息架构组件 1 数据资产目录 •通过分层架构表达对数据的分类和定义 … •厘清数据资产…•是建立数据模型的输入 数据模型 3 •通过E-R建模实现对数据及其关系的描述 •指导IT开发,是应用系统实 现的基础 数据分层结构 业务域主题域 业务对象 逻辑数据实体 属性 L1L2L3L4L5 业务术语 对数据资产目录业务对象在企业的统一定义 数据标准 数据标准 中内 数据架构 数据标准 数据分布 表达数据在业务流的流转 表达数据在IT系统的流转 定义数据产生的源头 数据源 数据流 信息链 述企业内需共同遵守的数 2 数据标准 •是业务定义的规范•统一语言,消除歧义业务术语•为数据资产梳理提供标准的 业务含义和规则数据标准 数据分布 4 •是数据在业务流程和IT系统上 流动的全景视图 •识别数据的“来龙去脉”•是定位数据问题的导航 对数据资产目录中属性描据含义和业务规则 建立数据质量管理框架和运作机制,每年例行开展两次公司级数据质量度量 数据清洁 领导力 数据质量文化 数据质量管控 数据质量政策 数据质量控制 数据质量度量 数据质量改进 数据质量目标规划 (SP/BP) 持续改进 数据质量业务需求 数据质量结果满意 能力支撑 数据治理平台 数据质量流程 数据组织 完整、清洁的逻辑数据湖 业务/数据双驱动做厚数据中台 华为数字化数据管理框架:以业务数字化为前提,数据入湖为基础,重点建设数据中台; 数据消费 满足自助式的数据消费 数据分析平台 …… 智能决策 风险预警 实时可视 自助分析 …… 业务流效率提升 XX数字化运营 XX数字化运营 XX数字化运营 数据资产管理 数据质量 数据分析管理 数据管控 信息架构 数据服务治理 共享与安全 指标管理 数据地图 元数据管理 同时加强数据隐私与安全、血缘、虚拟化和生态能力建设 数据底座 主题联接(中台) 数据湖 两种入湖方式、六项入湖标准 明确数据Owner 发布数据标准 销售系统 交付系统 内部数据 人力资源 客户管理 …… 数据服务 数据服务 批量/实时采集 外部数据 注册元数据 制定质量方案 定义数据密级 认证数据源 虚拟入湖 物理入湖 五种数据中台联接方式 以 算法模型 报告数据 智能标签 以对象(主体)为中心联接 业务流(事件)为中心联接 业务对象、规则、过程数字化 数据源 10HuaweiConfidential 业务数字化:通过规则数据,实现业务规则与应用解耦,规则可配置;通过观测数据, 业务对象样例 客户合同 产品 交付项目主计划 属性样例 客户合同号 签约日期签约金额 … 产品编码 产品商标产品序号 … 计划名称 计划开始时间计划结束时间 … 实现业务过程/轨迹自记录;持续推进业务对象数字化,丰富数据源 对象数字化 (建立对象本体在数字世界的映射) 规则数字化 (实现业务规则与应用的解耦,规则可配置) 过程数字化 (实现作业过程、轨迹自记录、信息化协同) 业务对象:是企业重要的人、事、物,承载了业务运作和管理涉及的重要信息。业务对象识别原则: •业务对象有唯一身份标识;•业务对象重要性原则;•业务对象相互独立并有属性描述;•业务对象可实例化; 三种类型 事务类 资源类 控制类 业务规则频繁变化并且组成业务规则的变量体量大的业务规则是规则数据管理的重点 业务规则:业务规则是企业内部定义业务事实、约束和控制业务行为的标准或声明。 规则数据:规则数据是支撑业务规则的核心数据,主要描述规则的变量部分。 业务过程:利用传感器IoT等技术,对业务对象的行为过程进行观测,形成观测数据,观测数据通常数据量较大且是过程性的,由机器自动采集生成,无需人工干预;需结合实际业务场景,方可产生价值; 观测数据:观测者通过观测工具获取观测对象行为/ 过程的记录数据。 样例1-设备GPS数据:ISC+样例2-网络访问日志:泰通过采集货物的GPS数据及模代通过使用员工访问当地型建设,实时计算动态到港时办公室网络日志数据,实间,解决了发货后需要多次沟时统计机关人员出差统计,通到货时间问题,大幅缩减沟解决人工统计周期长与数通成本。据不准的痛点。 主题联接(数据中台)建设:将数据按业务流/事件、对象/主体、标签、指标数据与算法进 消费场景 数据服务 数据服务 数据服务 数据服务 数据服务 对结果、质量、效率度量 例如:5个“1”度量 特定范围圈定 例如:CBG通过标签筛选目标用户进行产品推送 关联影响分析 例如:数通业务连续性分析AB(C)物料供应动态切换 多角度分析 例如:区域订货按合同、项目等维度分析 智能分析 例如:通过人脸识别算法实现智能门禁 业务指挥 业务决策 业务调度 业务协调 业务预警 业务预测 业务监控 行整合与联接,支撑业务的推演和根因分析 销售达人 云计算专家 员工 金牌讲师 论坛博主 指标 (原子) 叠加公式 指标 (复合) 以业务流(事件)为中心联接 (合同、销售订单等) 多维模型 ) 数据联接 关联公司 供应商 华为 自然人 以对象(主体)为中心联接 (供应商、客户等) 图模型 生交 BO产付 Q配配 置置 区域维 客户合同 MR 箱单 订单 客户维 多源异构整合 算法模型 (计划预测、机会点挖掘等) 算法与模型 如岭回归Ridge算法用于计划预测 报告数据 (原子指标数据、衍生/复合等 业务指标 维度/口径 指标数据(如门店数量) 支撑属性 度量 智能标签 (员工、用户画像等) 标签 合同接收合同评审合同签订合同注册 到货计划生产制造合同关闭 数据湖 数字化运营模式转变:由被动响应的“保姆式”开发模式,转变为基于统一平台和数据底 座的“服务+自助”模式 “保姆式”开发模式: 平均响应周期为30天 “服务+自助”开发模式: 服务建好后,业务实现报表周期为1-2天 数据需求解析与澄清 部署上线 方案设计 测试验证 IT版本计划 IT定制开发 用户提出需求 … 需求提出 开发实现 IT 定制开发 业务需求 … 用户自助完成应用建设 … 数字平台提供资源与服务 数据服务 …… 自动推送服务 主题数据服务 基础数据服务 定制化数据服务 工具服务 …… 数据地图 数据可视化 数据开放 大数据分析