IBM商业价值研究院|专家洞察 谋定后动,强化共识 聚焦主数据,全面提升数据治理能力 主专家题 张玉明 IBM副合伙人, IBMConsulting金融核心锐变团队数据转型与创新负责人zhangyum@cn.ibm.com 殷峻 IBMConsulting金融核心锐变团队数据转型与创新 资深咨询顾问 JunYin@ibm.com 程倾 IBMConsulting金融核心锐变团队数据转型与创新高级咨询顾问Qing.Cheng@ibm.com 王莉 IBM商业价值研究院高级咨询经理gbswangl@cn.ibm.com 张玉明先生是IBM副合伙人,IBMConsulting金融核心锐变团队数据转型与创新负责人,主要关注于金融行业数据中台、大数据战略与分析咨询、数字化战略转型、企业级数据治理及数据资产管理解决方案等方面。张玉明先生拥有超过15年的数据咨询与实施项目经验,领导过多个金融企业的大数据分析与人工智能技术应用、大数据应用架构、数据运营体系、业务咨询乃至系统实施项目。 殷峻先生是IBMConsulting金融核心锐变团队的资深咨询顾问。他有着超过20年的IT咨询与服务的工作经历,专注于为大型金融机构提供企业数据管理以及风险管理的解决方案。他在数据管理、风险管理和数据架构方面有着广泛的知识和技能,曾担任多个数据管理、风险管理项目的关键角色,在金融行业的信息系统建设方面有着丰富的经验。 程倾是IBMConsulting金融核心锐变团队的高级咨询顾问,她具备5年以上的金融行业数据战略规划、主数据、数据安全、数据标准等领域的咨询经验,为大型银行等金额机构提供数据治理、数据分析等方案及数字化转型服务。 王莉女士是IBM商业价值研究院的高级咨询经理,担任IBM全球高管调研项目和对标分析项目的大中华区项目负责人。她拥有15年以上的管理咨询和管理研究经验。王莉女士目前所关注的研究领域包括数字化转型、无边界企业、人工智能等,旨在帮助各行业客户创造新的商业机会、发现和传递价值。 理能力 谋主定数后据动,全,强面化提共升识数。据聚治焦 摘要 收益 数据治理工作的关键在于提升边际 不是所有的数据都具有相同的价值和重要性,通过集中精力处理关键数据,有助于解决重点和难点问题,同时优化资源分配,实现更大的治理效果和业务回报。 化蝶” 聚焦价值主线,实现数据治理“破茧 行动指南 主数据是企业最为关键的数据,应该围绕主数据开展数据认责1,建立和完善主数据标准,同时梳理和修复管理流程的断点,从而为数据治理带来事半功倍的效果。 深度优先、以点带面、协同推进。 企业需要在数据问题的优先级、重要性、影响性等多方面进行权衡,力争实现一举多得的工作成效。 AI时代的达摩克利斯之剑 ChatGPT是人工智能研究和发展的一个非凡的里程碑,面对生成式AI的卓越表现,CaixaBank首席执行官GonzaloGortázar感叹“生成式人工智能模型在同一时间给我们带来了惊喜、惊叹和惊吓”2。与此同时,企业也面临加速采用生成式AI的巨大压力。根据IBM最新的调研结果2,75%的受访CEO认为企业的竞争优势将取决于是否拥有最先进的生成式AI。CEO们看到了生成式AI的巨大潜力,但只有29%的高管认为组织内部已经做好了充分的准备。 企业中缺乏明确的数据计算和报告流程、数据集之间的标准/格式/频率不统一、对数据源可见性较差等萦绕在管理层心头多年的数据问题,依旧是阻碍企业拥抱和开发自有生成式AI应用的极大障碍。 实际上,在生成式AI出现之前,各类组织围绕数据问题已经开展了持续多年的治理。随着国际数据管理协会在2015年发布数据管理知识体系指南(DAMA-DMBOK)3,数据治理工作越来越多地得到企业的关注,并借鉴数据治理体系框架来提升数据处理能力和数据质量,进而推动企业的数字化转型工作。 一方面,企业在数据治理的框架下,从数据架构、元数据管理、数据标准、数据模型、数据质量管理等多个方面,投入了大量的人力和资源来提升业务数据的数据质量。根据McKinsey的估计4,一个中等规模的金融机构每年在数据治理上的投入大约在2000万到5000万美元之间。另一方面,在作出了诸多努力和尝试后,企业面临的数据问题和挑战似乎并没有减少,治理效果与预期之间似乎总是存在差距。据Gartner的估算5,企业每年因为数据质量问题而需要付出平均约为1290万美元的额外成本。 数据问题就像悬挂在数据管理者头顶的达摩克利斯之剑,在坐享数据带来的各种分析能力和深入的业务洞察的同时,还要时刻感受各类数据问题所带来的恐惧和困扰。而解决各类数据问题的成本和收益更是数据管理者不得不考虑和平衡的关键因素,毕竟企业的资源和投入都是有限的,需要在数据问题的优先级、重要性、影响性等多方面进行权衡,力争实现一举多得的工作成效。 谋定而后动,事半而功倍 在理想的情况下,数据治理的收益模型应该是:在治理的最初阶段需要一定投入,虽然取得的效果或收益较小,但是随着全面治理的持续推进,每年只需要保持一定的投入,也许不需要增长太多,就能够在某一个时间点之后,治理产生的边际收益逐渐大于边际成本,从而带来巨大的数据治理收益(见图1左图)。 然而,我们多年来在和诸多企业的交流过程中发现,实际的情况经常是截然相反的,那就是:在经历多年的数据治理之后,相应的数据治理投入逐年增加,但是取得的治理效果或收益却不尽如人意(见图1右图)。 产生这样的现象有多方面原因。众所周知,数据治理是一项复杂的系统工程,涉及到数据战略、组织架构、流程优化等方方面面的调整和配合,而缺乏高层支持、权责不清、数据定义不一致等都是影响数据治理成效的重要因素6。如何才能在纷繁芜杂的数据问题中,识别关键的问题突破口,从而走出“事倍功半”的困境? 结合数据治理能力的关键要素以及既往的实践经验,我们认为,在开展数据治理的具体工作之前,第一要务是识别和设定工作的切入点和突破口,将有限的资源、精力集中在最能提升数据治理边际效益的领域。 图1 理想(左图)与实际(右图)的数据治理收益模型 理想的数据治理收益模型 数据治理产生 的收益 数据投治入理的 第一年第二年第三年第四年第五年第六年第七年第八年第九年第十年 实际的数据治理收益模型 数据投治入理的 数据治收理益产生的 第一年第二年第三年第四年第五年第六年第七年第八年第九年第十年 主际效数益据管理能力决定数据治理的边 主数据是组织中需要跨系统、跨部门进行共享的核心业务实体数据7,也是非常重要的数据资产。以银行为例,通常将客户、产品、机构、员工等信息中涉及到多部门共享共用的关键数据项纳入主数据的管理范畴。这些关键数据对企业的决策和业务绩效会产生重要影响,其数据质量直接影响着商业决策的正确性和有效性,是企业各个层级、各个部门都关注、也必须面对的核心数据,具有“牵一发而动全身”的影响力。而主数据能够得到良好管理,通常意味着企业在关键数据的管理职责上是清晰的,相应的数据标准是明确的,总体的管理流程是完备的。 主数据管理的好坏对总体的数据治理效果会产生决定性的影响。因此以主数据为主线,建立清晰的数据治理策略和框架,同时加强各部门之间的沟通和协作,是提升数据治理边际效益的有效方法和手段。 作为在企业中被广泛使用且被多个部门或系统共享的核心数据,主数据问题通常表现出三“多”的特征,即问题涉及数据全生命周期多个阶段,问题的解决牵涉到多个部门、多个系统(见图2)。 以客户数据为例,通常会由零售业务部门、公司业务部门、信用卡部门、金融市场部门、普惠金融部门、运营管理部门等多个业务条线分别进行数据采集、维护和使用,不同渠道和部门采集的同一客户数据往往存在着数据内容不一致,甚至是数据冲突。因此有必要围绕客户主数据,明确这些部门在数据需求、设计、采集、加工、使用等各个环节的数据职责以及数据处理规范,否则当新的用数需求出现时,或是在存量数据问题的解决过程中,容易陷入推诿、争吵、一事一议的漩涡。 图2 主数据问题的三“多”特征示例 需求 需要哪些部门配合? 改提造出需?谁求来应牵由头哪和个协部调门? 设计 采集 相录采应入集的的时信道候息和是进应否行用需验系要证统对?验证过程证需据要?提供哪些 是否需要进行标准化? 存储 共享 一到旦哪地些址下改游变系需统要?是同否步存的在数一据些无场法景进使行得同最步新? 对的账改单造地涉址及和哪联些系系地统址?数据分情布况以如及何数?据流转 为客同户一对联数账系据单地项寄址进送是行地不处址是理和作? 破茧化蝶 以主数据为突破口,实现数据治理 “” 之所以围绕主数据管理开展数据治理,是因为主数据所具备的重要性和共享性的特征,容易凝聚企业各个层级的治理共识。以产品主数据管理为例,产品的研发、管理、销售和服务是各个业务部门开展工作的重要内容,一个立体的、一致的、全面的、集中管理维护的产品数据载体是业务部门对内管理的迫切需要。从外部服务的视角来看,也是前台部门对客户开展各类营销、推广、展示的关键载体。对于管理层来说,是了解经营现状和发展趋势的重要抓手。 通过加强主数据管理能力来提升数据治理边际效益的关键,可以归纳为以下三个方面: –多方协同:在现实场景中,经常会看到数据管理部门单独推动数据治理议程的现象。而主数据管理的关键在于通过对核心业务数据开展认责,将数据治理 的职责从数据管理部门,延展到业务主管部门以及技术管理部门,进而推动关键业务数据全生命周期的协同管理。 –焦点选择:“帕累托定律”指出,应该把精力和资源投入在重要的事情上,而主数据管理的重要特征之一是聚焦,通过对客户、产品、机构等领域的主数据项(通常每个领域不超过100项)进行梳理、分析和治理,使得企业能够在有限的资源和投入下,确保对关键业务数据的有效管理。 –机制复用:一旦围绕企业的关键数据能够形成体系化、可落地的数据管理制度、流程和规范,那么这些通过实践磨合、积累、沉淀下来的工作机制和成果,就能够作为企业数据治理的重要手段和能力被有效拓展和应用到其他数据领域,从而形成“举一反三”的作用和效果,进而带动整体数据治理水平的持续提升。 5 科学定位,精准施策 在确定了以主数据管理为突破口的策略之后,首先要明确管理定位问题。以产品主数据管理为例,管理层通常会关注以下四方面问题: –管理成熟度:从主数据管理的视角,管理能力的成熟度分别有哪几个等级,分别具有何种特征?当前以企业级产品目录为依托的产品主数据管理能力和水平处于哪个阶段? –改进方向:结合企业的实际情况,当前的产品目录管理需要从哪些方面进行改进和加强?分别需要哪些部门的配合和支持? –协同机制:如何建立稳定、高效的协同工作机制,在有限的人力和资源投入的情况下,促进各部门相关人员的协同? –实际效果:后续开展的一系列工作和投入,是否能够解决当前在产品规模、损益等数据统计分析上面临的痛点和问题?对于产品参数管理或者产品工厂建设是否有实质性帮助? 针对前述问题,建议围绕四类主数据管控的典型模式,构建产品主数据管理能力成熟度模型(见图3),并据此明确产品目录管理、产品参数管理以及产品工厂等关键概念的区别和联系,同时结合企业的实际现状,梳理各个成熟度等级之间的演进策略和相应的能力要求。 在建立产品主数据管理能力成熟度模型之后,如何进行科学定位还应该与主数据管理的关键能力领域相结合。在产品主数据管理方面,四方面关键能力领域包括: –产品主数据管理组织:主数据管理的关键是相关各方的协同,需要通过制度和办法的形式将产品管理统筹方、各类产品的主管方、产品系统所属的业务方等各方的职责和管理边界明确下来,同时制订协同管理的工作机制,通过产品主数据管理各方的交流和协同,持续提升企业级产品目录的管理效率和作用。 图3 产品主数据管理能力成熟度 初始级:产品数据集成 受管理级:产品目录管理研发级:产品参数管理敏捷级:产品工厂 创建/更新 查询创建/更新 管理 创建/更新查询 查询管理 创建/更新查询 管理 MDMMDMMDMMDM 业务系