行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

数据领导者扩展人工智能的操作指南

信息技术 2024-09-01 麦肯锡 GHK

麦肯锡全球调查发现，65%的公司定期使用生成式AI，但多数尚未看到显著商业影响。企业需从“Tech for Tech”和“试验和错误”两大陷阱中走出，建立以数据为中心的运营模型以规模化部署生成式AI。

核心观点与关键数据

运营模型的重要性：运营模型定义了人员、流程和技术的部署方式，涵盖从人员配置到技术开发的全过程。65%的公司已制定生成式AI策略，但需进一步建立运营模型以实现可衡量的业务成果。
基于组件的架构：31%的高绩效企业与11%的其他企业采用组件化方法，通过分阶段部署新组件（如LLM托管）实现业务目标，同时保持技术栈灵活性。
团队构建：
- 扩展现有团队：成本较低但可能受限于传统IT流程，如某物流公司试点项目因整合问题部署缓慢。
- 独立团队：可快速迭代但需与IT部门协调避免重复工作，如某欧洲银行通过专项小组实现快速启动。
数据管理：
- 建立“企业级中心（CoE）”集中管理非结构化数据，确保合规性与质量。
- 按业务领域优先级（如财务、人力资源）分阶段推进，避免需求淹没。
开发模式演进：
- 集中式：由中央团队主导，如某电信公司以业务单元节点形式运营。
- 联邦式：IT提供统一基础设施，业务单元负责领域内开发（如某北美投行）。
- 分散式：各领域组建自主团队（如某营销部门开发社交媒体代理供其他领域使用）。
风险与合规：
- 制定六步风险计划：识别威胁、分类工具、分层部署、跟踪风险、组建团队、全员参与。
- 强调动态调整以应对法规变化（如欧盟AI法案的透明度要求）。

研究结论
企业需以数据为核心，通过明确的运营模型（组件化架构、分级团队、动态数据管理）实现生成式AI规模化部署。中央IT团队需提供统一基础设施，业务单元逐步承接开发任务，同时建立灵活的风险治理机制以平衡创新与合规。

南，以扩展 gen AI 企业在部署生成式AI时需要一个以数据为中心的道路规划。领导者可以利用一个明确的运营模型成功规模化该技术。这篇文章由Alex Singla、Asin Tavakoli、Holger Harreis、Kayvaun Rowshankish和Klemens Hjartar共同撰写，Gaspard Fouilland和Olivier Fournier代表麦肯锡技术和QuantumBlack（麦肯锡的AI咨询部门）的观点。在对生成人工智能 (generative AI) 痴迷了近两年之后，公司走过蜜月阶段1接受最重要的工作：从这种诱人的技术中创造价值。期望很高。最近的高级管理人员（CDOs）往往带头创建这些模型——将技术、人员和流程结合起来，将通用人工智能（gen AI）的潜力转化为实际影响。然而，在创建gen AI运营模式时，数据领导者往往会落入两个陷阱：麦肯锡全球调查发现如今各规模、地域和行业中有65%的公司定期使用生成式AI，这一数字是去年的两倍。2投资于通用人工智能继续上升，因为相信早期高绩效公司所获得的初步收益预示着未来成本的降低和利润的增长。但大多数公司尚未从通用人工智能中看到显著的影响。 —Tech for Tech:这种方法涉及将大量资源分配给通用人工智能（Gen AI），但缺乏明确的商业目的，导致生成的解决方案与实际影响脱节。这可能导致在日常工作中很少使用的通用人工智能工具上的过度支出，并创造较少的商业价值。为了跟上创新竞争的步伐，大多数组织的数据执行官已经制定了生成式AI策略。虽然并非所有公司都已超越了试点阶段，但大多数公司已在不同程度上将AI整合到了他们的技术栈中。然而，技术集成模型是生成持久价值所必需的部分。 companies必须还创建生成人工智能运营模型以确保其技术实施能够产生可衡量的业务成果。 —试验和错误：这种做法涉及尝试不同的生成型AI项目，但并非以协调的方式进行。这在技术、零售和银行业等領域中尤其具有特定风险，因为在这些领域，生成型AI有潜力迅速提高生产效率。而在农业和制造业等行业中，生成型AI可能需要更长时间才能对生产效率产生显著影响的企业，则可以考虑推迟部署这项技术。运营模型是大多数大型组织中常见的结构。公司的运营模型是一种计划，概述了如何部署人员、流程和技术以向客户和利益相关者提供价值。它可能包括财务结构、合作伙伴关系以及产品路线图，以实现公司的长期目标。具体应用于生成式人工智能（gen AI），运营模型涵盖了从人员配置和组织结构到技术开发和合规性的每一个决策，这些决策指导着生成式人工智能在整个公司内的使用和衡量方式。许多企业领导人感到有必要尽快部署通用人工智能（Gen AI）。这为数据负责人争取到机会，以获得批准实施以数据为中心的GenAI运营模式。当CDO及其高管支持者准备好定义通用人工智能（Gen AI）运营模型时，应采取哪些初始步骤？企业应采取哪些措施以确保这些运营模型符合风险、治理、安全和合规要求？我们提供了一本实用指南，数据领导者可以使用该指南来创建通用人工智能运营模型，包括如何构建人才团队、组织数据资产以及确定集中式开发或领域中心化开发哪种方法最为适宜。一个明确的通用人工智能运营模型可以帮助领导者成功且安全地在整个组织中规模化部署通用人工智能。数据是成功部署通用人工智能的基石，因此首席数据官的角色至关重要。关于麦肯锡科技麦肯锡技术部门与私营、公共和社会部门的组织合作，在云服务、数据转型、技术战略、风险与修复以及人工智能等领域创造机会。麦肯锡技术部门由超过2,500人组成，在每个地理区域——包括开发者、工程师、建筑师、策略师和分析师——他们结合了技术专长和深厚的专业知识。我们与组织紧密合作，以交付他们今天需要的技术转型，并建立拥抱下一步的能力。架构。这种方法使银行能够在三个月内实施其实现核心通用人工智能（gen AI）用例的80%（见图1）。通过早期识别出具有最大潜在影响的gen AI组件，该银行集中其开发资源来生成与明确的中期和长期目标相一致的gen AI功能。然而，尽管基于组件的方法对于扩大通用人工智能至关重要，但只有31%的gen AI表现优异的企业和11%的其他企业采用了这一模型。3 围绕组件设计新一代 AI 操作模型生成人工智能的创新正以极快的速度推进，因此设计一个利用组件的运营模型是有道理的。通过这种方式，公司可以制定计划，在定期间隔内将新的生成人工智能组件添加到企业架构中，并且这些添加方式要与业务目标保持一致。该运营模型允许对生成人工智能组件进行更改，而无需彻底重构技术栈。在一方面，将生成式AI功能添加到需要较少常规更新的成熟元素中，如云托管和数据分块，这需要更高的投资水平和实施复杂性。在另一方面，快速变化且生命周期较短的元素，如代理和大型语言模型（LLM）托管，应易于快速实施并快速更改。为了成功采用基于组件的生成式AI开发模型，公司可以组建一个专项小组来审查、更新和演化路线图。该专项小组还负责分配执行计划，确保信息技术、数据、AI和业务团队对特定部署具有适当的职责划分。这需要与各种相关方进行清晰的沟通，包括AI工程师、软件开发者、数据科学家、产品经理和企业架构师，并定期向业务主管报告进展情况。协调工作至关重要，以确保组件的部署系统化并与其组织目标保持一致，而非呈现为一系列不连贯的试点项目。在这一领域，组织可以具备灵活性，首先实施关键通用人工智能（gen AI）应用场景所需的最小必要组件，然后根据需求的变化逐步添加和移除组件。例如，一家领先的欧洲银行在其企业内部部署了14个关键的通用人工智能组件。附件 1 选择扩展的或不同的 gen AI 团队 Several领先的欧洲银行已经成立了这样的通用人工智能（gen AI）专项小组，旨在潜在地发展成为全方位卓越中心（Center of Excellence, CoE）。在医疗保健和金融服务等高度监管的行业中，创建新的、集中的通用人工智能团队似乎也是最佳实践。采用这种方法，这些公司能够在几周内启动多个通用人工智能项目，而不是几个月。在构建生成型AI运营模型时，定义一个核心团队至关重要。主要有两种选择：扩展现有的数据或IT团队，为其配备新的生成型AI技能，或者建立一个独立的生成型AI团队。后者可以通过从现有数据或IT团队中选拔人员，或者招聘新人才来实现。每种方法都有其自身的优缺点。无论是哪种模型都有可能成功，但两者都存在公司需要谨慎避免的陷阱。如果生成式AI团队与IT部门分离，其发展规划仍应与更广泛的IT组织保持一致，以避免重复努力或在多个地方构建孤立的生成式AI组件。每个组件的能力范围和所有权应明确定义并在整个组织内共享。例如，生成式AI工作组可以监督提示工程和边界条件、大语言模型操作和编排以及模型改进——但不应涉及数据摄取、管理和存储。将现有的数据团队负责生成式AI（gen AI）似乎是个更简单的选项，尽管随着生成式AI的发展，这种局面可能会发生变化。例如，一家领先的物流组织将其IT组织扩展到包括数据团队，以启动多个生成式AI项目。该公司将生成式AI纳入其数据和分析路线图中，鼓励现有团队提升生成式AI能力。尽管公司成功部署了一个生成式AI试点项目，但其范围有限。而且，由于生成式AI产品被整合到公司的整体技术平台中，未来部署速度比预期要慢，需要时间来确保与现有系统的合规性。然而，如果生成式AI团队作为现有IT和数据功能的衍生部门扩展，该团队将需要成功管理两种截然不同的技术生命周期。特定的生成式AI组件，如大语言模型（LLM）托管和模型枢纽，将需要比传统IT和数据组件（如托管和容器）更快地进行开发并投入生产。解耦gen AI团队与IT或数据组织具有不同的优势。这种做法使组织能够从零开始构建一支新的高技能gen AI团队。凭借坚实的数据和AI架构基础，新团队可以迅速在外围IT功能之外迭代gen AI组件。无论一家公司选择扩展其通用人工智能（genAI）团队还是保持独立的团队，重要的是中央IT团队需要定义一个共同的基础技术架构，将所有通用人工智能工具整合在一起。由于许多数据团队对处理非结构化数据可能不够熟悉，该过程应由专家以集中方式启动。这些专家通常是训练有素的数据工程师，专门处理非结构化数据，以及自然语言处理工程师，组建成一个企业级中心（Center of Excellence,CoE）。他们建立并实施管理非结构化数据的流程，使其能够被通用人工智能系统访问。他们确保公司在通用人工智能运营模型中的政策提供关于何时何地使用数据的视角。他们还确保数据质量、风险管理及合规性的统一标准得到一致执行。避免此步骤可能会导致合规性问题或技术债务- 修复最初是为了速度而不是质量而构建的越野车产品所需的额外工作。在战略业务领域确定数据管理的优先级正如每位数据领导者所知，有效的数据管理是实施通用人工智能（gen AI）的关键因素。没有功能性的数据组织，gen AI 应用将无法检索和处理所需的信息。然而，大多数企业报告在数据利用方面存在重大障碍，包括模型再利用性、可访问性、可扩展性和质量等方面的问题。因此，在任何gen AI 的运营模式中，都应该包含数据管理和治理策略。治理包括管理文档的来源、准备、整理和标注，以及确保结构化和非结构化数据的质量和合规性。然而，一旦CoE提供了部署路线图，业务领域的专家（具有业务监督权）应接管数据管理过程。他们比单独的数据专业人士更能从其领域内的特定记录中提取知识。随着业务单元开始为更多样化的用例提供更多高质量的数据，集中式数据团队往往会被需求淹没，并且缺乏检查数据质量、真实性和领域特定文档标记的专业知识。管理公司整体数据中超过80%的非结构化数据可能看似是一项艰巨的任务。4确实，60%的生成型AI高绩效企业和80%的其他公司难以定义组织其非结构化数据的全面策略。5为了应对这一挑战，组织可以根据业务优先级优先考虑未结构化数据的具体领域和子领域。例如，一家公司可能优先考虑一个数据领域，将所有正在开发的生成式AI产品归类到一个业务单元中，而另一家公司可能优先考虑一个与特定功能（如财务或人力资源）相关的数据领域。理想的领域和子领域应该小到足以采取行动，同时大到能够提供显著且可衡量的结果。计划采用分散的方法进行 General AI 开发随着领域团队在数据管理方面的能力不断增强，公司可能会选择逐步增加这些团队在生成式AI（gen AI）开发方面的所有权——从集中管理模式过渡到联邦管理模式，最终实现去中心化管理（如图2所示）。前瞻性数据高管可能希望确保其生成式AI运营路线图中包含未来去中心化开发的场景。有三种方法可供考虑。首席数据和人工智能官的领导。该公司能够迅速组建一支知识渊博的生成式AI团队，通过将现有员工纳入一个中央单位来实现这一目标。这种方法降低了开发成本，并减少了多个团队创建类似项目的风险。 Centralized gen AI 一些公司选择将生成式AI集中在其各自的领域。这使组织能够快速构建能力并控制成本。一家领先的全球电信公司采用了这种模式，将生成式AI作为其业务单元的一个节点来运营。附件 2 通过通用基础架构统一联盟团队联邦一代 AI 随着公司构建通用人工智能（gen AI）专业知识，它们通常会选择联邦模型，在这种模型中，业务单元不仅负责消费与其领域相关的数据，还承担数据处理和存储的任务。该模型允许各领域将通用人工智能更深入地集成到日常工作中，以实现更强的业务成果。尽管各业务单元清楚自己需要利用通用人工智能（gen AI）解决哪些日常问题，并因此能够在各自领域内构建特定用例，这一分散化的开发过程绝不能牺牲公司的整体安全性和韧性。相反，公司应确保IT团队构建并管理一个底层的共同基础设施，所有gen AI工具均基于此进行开发和部署。IT团队还应负责构建可重复使用的平台，供各个业务单元使用，例如提示

点击免费查看完整报告

数据领导者扩展人工智能的操作指南

你可能感兴趣

前沿者的AI扩展指南：来自行业领导者的经验教训

成功扩展人工智能的领导者的五个教训

人工智能领导者数据策略建造互操作湖屋

人工智能规模化先行者指南：行业领导者的经验

扩展的东盟人工智能治理和伦理指南——生成型人工智能

人工智能规模化先行者指南：行业领导者的经验（英）

以人工智能获胜：业务领导者从战略到执行的AI指南—— IMD playbook

操作人工智能指导：将高层次目标转化为实际实施的参考指南

白皮书：伦理人工智能的五大支柱：金融机构合规与负责任使用人工智能的操作指南。

数据领导者的 Scaling gen AI 技术指南