特A定于企业的 I代理保持 GenAI承诺 定制的企业专用生成AI使得更快地实现业务目标成为可能,同时产出更具洞察力和创新性的内容。这可能是公司最大限度利用自身结构化和非结构化数据的最有效方式。 2024年诺贝尔科学奖(物理学和化学)授予与人工智能相关的发现,确认了人工智能对现代生活的重要性。诺贝尔奖得主GeoffreyHinton指出,与生成式人工智能相关的机器学习方面将“产生巨大影响。它的重要性将堪比工业革命,但不同于增强人类体力,它将超越人类的智力能力。”1 公开数据和增加处理能力不足以带来特定领域的改进以及扩展必要的能力以证明投资的合理性。它们缺乏专门且高质量的数据,无法在公司的专业领域内具备专业知识。这类数据通常被锁在企业的防火墙后面,或者对通用型的大语言模型(LLM)训练来说不可用 。因此,即使是像ChatGPT或Gemini这样的顶级聊天机器人,基于LLM构建,也可能产生错误的答案,或者“幻觉”。 尽管生成式AI尚未广泛使用,且已有一些公开报道的生成式AI意外错误案例,因此,组织对将其整合到战略、流程和商业模式中可能带来的潜在益处持谨慎乐观态度。2 尽管大型语言模型(LLMs)具有重塑业务的潜力 ,但在处理未经过训练的专业领域时会遇到性能上限。用户被警告不要完全信任其回复,尤其是涉及独特且组织特定的信息的问题。仅仅通过提供更多训练数据并不能解决问题。 相应地,有一些充分的理由对待生成式AI现象保持一定的距离,但其对企业基本的益处尚未在经济中得到广泛或全面的利用。特定于企业的、即定制私有生成式AI,也被称为代理AI,可以通过使用透明、可访问的来源和可验证的结果来提高准确性。这种形式具有更强的能力专注于特定领域,并通过针对特定商业领域的精炼数据进行训练,产生上下文相关的结果。代理AI的实施允许在更复杂和高级的场景中扩展使用案例。 1《经济学人》的巴贝奇,2024年诺贝尔奖:AI的胜利,Oct.9,2024 2凯捷研究院利用生成AI的价值,p.27 2企业特定的AI代理保持GenAI承诺©Capgemini2024。保留所有权利 专注于更好的结果 通用大语言模型可以成为提高生产效率的有效工具,但它们缺乏具体性降低了输出的相关性和质量。它们往往会生成通用的结果,而这些结果未能充分利用组织自身知识产权和数据的全部潜力 ,从而无法产生可操作的洞察和提升生产效率。 公司独特的专有见解最有可能产生使其脱颖而出的创新。据商业情报提供商Gartner称,68%的企业在尝试将AI集成到高度依赖内部数据的工作流程中时面临挑战。3 定制私有生成式AI使得更快响应商业机会成为可能 ,能够提供更为深刻和原创的内容。这是公司最大限度发挥其各种形式知识产权价值的最有效方式之一。没有生成式AI的强大数据解读能力,其中许多价值将无法实现。 沉睡的、隔离的且被遗忘的。meanwhile,公司重复造轮子、浪费时间和预算,并错失机会 。 为了实现生成式AI对企业生产力和创造力的最大效益,可以通过对组织自身全面的数据集(包括结构化和非结构化数据)进行定制训练,来培养一种专门的企业AI代理。这种企业AI代理具有更高的推理能力,能够在专业领域产生更为精炼的回应。 理想的生成式AI模型能够在整个workforce提升生产力。例如,它可以简化业务开发团队响应RFPs的过程,加快HR部门选择合格人才的速度,或提高客服中心客户互动的质量。 3Gartner,企业数据战略中的RAG 3 保护GenAI数据 在使通用人工智能(GenAI)成为更有效的业务资源的同时,自定义私有GenAI系统具有重要的伦理和合规理由。其闭环结构允许更加严格的治理 、安全协议和持续监控,以确保其符合公司的自身伦理和安全标准,并在适用的情况下遵守数据隐私和主权要求。 了解用于数据训练的方法对于管理法律风险至关重要。这些风险是真实的 ,已有可信的版权和商标侵权案例正在展开。4专有LLM由于其严格控制,透明来源的培训数据而更安全。 通过在robust安全控制和伦理AI性能的主动保护之间寻求平衡,组织可以在保护其关键资产的同时培养信任并增强运营韧性。 数据安全因更为严格的运营韧性监管要求而上升至董事会议程的更高位置。自定义私有生成式AI助理使公司能够实施严格的数据安全措施、保留其知识产权的完整所有权,并更清晰地了解潜在的安全漏洞。 4路透社,人工智能公司在驳回部分视觉艺术家版权案的竞标中失败,2024年8月13日 4 The数据摄取框架-提供完整的GenAI价值的关键 自定义私有LLM的关键组件是其数据摄入框架(DIF )。DIF对于分析数据集中的文档和其他材料并赋予其意义至关重要,从而决定了其生产性。它提取、组织并准备数据以供将来检索。通过应用元数据进行本体论目的,确保模型能够在适当的时间访问到正确的信息。目标是更好地针对所需的信息进行定位。 为了查询,使知识管理与领域特定辅助更加高效。因此,查询可以通过数据来自正确的文档和最适用的部分来得到解答,这是一项对于领域特定应用场景和有效知识管理至关重要的能力。 支持使用定制化的检索增强生成(RAG)来辅助训练好的大规模语言模型(LLM),可以提高响应的准确性。其中,LLM是一种训练好的人工智能系统 。 在一个大型已知数据集上,RAG是一个信息检索系统,可以从现有数据库和文档中挑选出特定且相关的数据。与固定不变的LLM相比,RAG模型是动态的。LLM的优势在于特定且明确的情景中,而RAG则能够在广泛匹配并提供最新信息的同时,由于缺乏精确性变得更为灵活,因此设置好边界条件至关重要。5 5 走向数据科学,RAG的实际局限性和优势,2024年4月15日 5 多级护栏 大模型系统依赖于多个阶段的“护栏”以确保质量并减轻风险。“护栏”还通过消除有害和偏见的输出来使GenAI系统与组织价值观保持一致。 中间防护栏随后作为检索过程中的检查点,验证选定的数据是否与政策及查询上下文保持一致。 第一层控制始于输入过滤,这一过程会检查用户提示的具体内容以确保其合规性和风险因素。例如,一个请求敏感策略或方法论的查询,比如如何重新设计内部流程,可能会无意中暴露机密信息。这在受监管的行业(如银行、医疗保健和国防)尤其重要,在这些行业中,严格遵守标准禁止与外部AI系统或供应商共享敏感数据。 最终输出过滤器会在信息检索完成后但在传递给用户或下游业务流程之前对响应进行评估。该过滤器确保响应符合关键要求,如保密性、适宜性(例如 ,无毒害或有害内容),以及公司政策和监管标准的合规性。此外,它还确认输出满足用户对准确性和相关性的期望,作为最终的质量控制步骤。 6 成本控制 运行大型语言模型(LLM)的成本如果未经控制,可能会因依赖密集的计算资源和基于令牌的定价模型而急剧上升。这与处理的提示数量以及生成响应的长度直接相关,使得广泛的或复杂的查询变得极其昂贵。根据2024年的报告,65%的企业难以预测LLM的使用成本,一些公司因缺乏有效的监控和控制而出现了超过30%的意外预算超支。6 使用自定义LLM结合RAG的一个主要好处是能够将计算负担转移到更便宜的检索机制上。RAG框架可以实时检索企业数据,使LLM专注于仅生成内容。 总结或特定上下文的输出而非处理整个数据集。这种混合方法可以减少25-35%的计算成本。7 成本控制措施集成到与RAG系统结合的定制大语言模型(LLM)中,并通过token使用监控,使企业能够在不出现财务意外的情况下利用生成式AI的强大功能。通过专注于特定任务的应用和简化的工作流程,组织可以更好地预测开支,并使其AI投资与业务优先事项保持一致。 6Gartner,企业AI成本控制报告 7Forrester,通过及时的工程和高级LLM应用程序架构构建高效而强大的GenAI应用 程序 7 使用针对领域和业务功能量身定制的自定义私有生成AI代理的GenAI解决方案示例 Finance 在财务报告、市场营销、运营和供应链管理中实现数据自动化分析;基于数据的主动推荐以减少手动分析时间。 银行和保险 信用备忘录生成契约监控可疑活动报告及其他金融犯罪报告提交PitchBook生成索赔处理,例如法律案例包创建承保助手 医疗保健提供者 纵向患者总结临床试验方案生成个性化医疗研究助理代理 Sales 通过使用生成性人工智能代理作为组合销售执行官来识别交叉销售机会初次报价RFP/RFQ响应生成客户意向/洞察代理 研究与开发 合成数据生成增进药物发现与治疗新型蛋白质设计临床试验与研究辅助 8 关于凯捷 赛峰是一家全球性的业务和技术转型合作伙伴,帮助组织加速向数字化和可持续世界转型,同时为企业和社会创造实际影响。这是一家拥有340,000名员工、遍布50多个国家的负责任且多元化的集团。凭借超过55年的深厚底蕴,赛峰凭借其强大的技术实力,受到客户信任,助力他们发掘技术价值以满足整个业务需求。该公司通过策略与设计到工程端到端的服务和解决方案,利用其在人工智能、云计算和数据领域的市场领先能力,结合深厚的行业专长和合作伙伴生态系统,推动业务发展。该集团2023年全球营收为225亿欧元。 得到你想要的未来|www.capgemini.com ©2024凯捷。保留所有权利。