德意志银行研究 我的AI革命在哪里?实用 方法,你可以得到更少的聊天,更多的行动 #积极影响 2023年11月 AdrianCox 专题研究(+44)-20- 7541-7775 GalinaPozdnyakova(+44)-20-754-74994 重要的研究披露和分析师认证位于附录1。MCI(P)097/10/2022。直到2021年3月19日,未完成的披露信息可能已经显示,有关更多细节,请参阅附录1。 图片来源:DALL-E AI无处不在。为什么? 图片来源:DALL 自推出以来,生成型AI无处不在,无处大约一年前的ChatGPT。 批评者指责基础大语言模型(LLM)技术的缺点。但是技术不是一个孤岛:它不仅取决于以前的创新,还取决于人们将其加入并将其装配到需要时间来创建和推出的硬件和软件框架中。 有时这些元素永远不会融合在一起:从中美洲挖出的轮式“玩具”显示了如果没有马匹或牛来拉,您如何理解车轮,但又无法飞跃到诸如手推车和战车之类的实际应用。 相比之下,生成AI的资源并不短缺。企业早期使用它的障碍很大,但更多的是行人:技术和数据,治理和人员。 在本实用指南中,我们解释了为什么这些障碍很重要,以及您如何在自己的公司中开始克服这些障碍,从而朝着生产力和创造力革命迈出一步。 目录 I.为什么生成AI仍然是等待的革命? II.从绘图板到会议室 III.实用指南:技术与数据、治理、人员 IV.附件:相关研究公司www.dbResearch.com/ai I.为什么生成AI仍然是等待的革命? 100 80 60 40 20 在编码,数学和基于语言的知识测试中表现最佳的AI系统* * 数学和知识测试:专家人类的近似分数 所有知识测试数学 编码竞赛编码访谈STEM 社会科学人文科学 知识测试:非专家人类的平均分 300 250 200 150 100 50 0 250 200 150 100 按类型划分的全球企业对人工智能的年度投资(十亿美元)* 少数股权公开发行私人投 资并购 2013201420152016201720182019202020212022 在公司成绩单中提及生成性AI主题 0 2月19日1月20日12月20日11月21日 Oct-22 50 标准普尔 斯托克600 0 第三季度2022Q42022Q12023Q22023Q32023 人工智能变得越来越聪明,资金越来越多……每个人都在谈论它 来源:NetBaseQid通过AI指数报告(2023),带有代码的论文(2023),我们的数据世界,彭博财经LP,德意志银行。*注:数据以2021年不变美元表示。通胀调整基于美国消费者价格指数(CPI)。**注意:编码性能是通过APPS基准测试来衡量的;数学性能是通过MATH基准测试来衡量的;以及基于语言的知识测试是通过MMLU基准测试来衡量的。不应直接比较这些基准的性能,因为它们使用不同的性能指标并测试不同的技能。 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% US欧洲* 我的AI革命在哪里? 尽管美国和欧洲大约三分之二的人听说过ChatGPT和其他AI助手,但只有五分之一的人尝试过ChatGPT,企业对生成AI的使用仍然有限,主要是实验性的 在那些听说过AI助手的受访者中: 听说过AI助手 当前的就业地点刚刚开始使用AI助手 已使用/尝试过ChatGPT 资料来源:dbDIG,德意志银行。*注:欧洲是英国、法国、德国、意大利和西班牙的平均值。 客户抵制 3.People 人才库有限管理阻力员工电阻 2.治理幻觉:诽谤等风 险 偏见:声誉风险 不明来源:法律/知识产权风险 协调战略和利益相关者 监管机构不确定性 企业AI革命的三个障碍 即使公司有充分的理由使用AI,也存在许多障碍,从技术和数据到治理,其中一些是AI特有的,再到公司内外的人 1.技术和数据 来源:德意志银行 与遗留系统的复杂技术集成 需要量身定制、安全 、高质量的数据 数据隐私:泄漏风险 多个推动者加在一起,使技术成为可能 •全球定位系统(GPS), 1978 •SIM卡和商用GSM漫游标准,1991 年 •PayPal前身成立,1998年 •第一批集成照相手机,2000 年代初 苹果iPhone 2007 用例和新技术出现 •AppleAppStore,支持第三方开发, 2008年 •Uber,2011年和DoorDash食品交付应用程序,2012年,由智能手机以及地图和支付软件启用 •2016年,移动网络使用超过PC,促 进社交媒体 创新的历史表明,没有技术是一座孤岛 生成AI具有许多功能,例如使软件开发和交互变得前所未有,但历史表明,随着功能与新的软件和硬件融合,杀手级应用程序需要时间才能发展。 通往生成AI的道路 •传统的,象征性的,良好的老式AI(GOFAI),1950年代至2000年代,例如基于规则的模式识别 •AlexNet深度神经网络,2012年和 Transformer,2017年,在计算能力和数据呈指数级增长的帮助下 •GPT-1,2018,到GPT-3, 2020 OpenAIChatGPT2022年11月 30日 用例和新技术仍然存在出现 •第三方插件,高级数据分析功能,企业治理,2023年 •早期用于自然语言任务,副驾驶, AI助手 •新的集成软件或硬件,例如增强/虚拟现实,导致杀手级应用程序? •企业仍在尝试 I.从绘图板到会议室 更大... 收入与成本重点治理问题的复杂性 中断 Processes 商业模式 •在现有生产和交付中存在摩擦的地方-即使尚未意识到 AI颠覆价值链的范围长期 •以收入为中心;新的机会参赛者 •新的商业模式可能会破坏性地将AI与其他技术结 合起来 中期 •以成本为中心;现任者的机会 •简化操作;提取更多 •成本高昂、重复且效率低下的地方 •半自动化流程已经提供了大量数据来识别运营模式和模板 任务 来自专有数据的价值;改进的软件工程;可能会影响第三方、劳动密集型功能,如客户服务 短期 •重复的地方,可以通过一系列步骤进行记录 •自然语言和非结构化数据以前不受自动化的影响 •提高工作效率;自动化或重新设计结构化任务 •人工智能实施可能包括由工具(例如副驾驶)增强的个人生产力 您如何在业务中使用生成式AI? 在适当的时候,创新将破坏商业模式 来源:德意志银行 增强 搜索, chatbots和 副翼 检索增强生成 提示 e工程 (RAG) 训练自己的基础模型 微调 •可以是免费的,包括增强搜索(例如GoogleBard,MicrosoftBing )或基本的聊天机器人(例如ChatGPT,它依赖于信息的训练数据) •高级模型包括企业附加组件(例如,您的数据不用于培训) •Copilot,例如Microsoft的新365Copilot,使用LLM来利用来自各个用户应用程序的数据 •通过几个例子给出尽可能多的上下文(“少量学习”) •因此,答案比使用搜索引擎等聊天机器人更相关 ,通常更准确 •几乎不需要编程,但确实需要反复测试哪些提示效果最好 •比即时工程更可靠的结果 •直接使用来自信息存储的特定上下文(即您拥有和信任的数据) •更复杂的工程师;通常使用一个框架,如LangChain,和“矢量存储”为您的数据 •灵活,因为零件可以根据需要调入和调出 •比RAG略好的结果 •使用特定于域的数据更新模型本身,因此给出了更多的上下文答案 •更复杂的编程和治理问题 ,公司需要更新 •相当不灵活,因为需要更新权重和参数 •最高质量的输出:准确且不易产生幻觉 •模型是在特定于您的用例的数据上从头开始训练的 •实施起来非常复杂,昂贵且耗时,包括管理大量数据并维护再培训周期 企业有哪些选择? 使用LLM与数据进行交互的方法有很多,包括总结、问答和想法生成;在风险很高的地方,成本和复杂性大幅上升,信息需要准确和相关 通常情况下,更量身定制(相关和准确),复杂,难以实施,昂贵和安全 来源:德意志银行。有关检索增强一代(RAG)工作原理的示例,请参阅附件 关键初始标准 •可取性(客户:相关性) •可行性(业务:成本) •可行性(技术:能力) 成功的关键因素 •质量(精度和速度) •解的复杂性 •努力实施和改变 •Cost •安全 优点 较低的初始成本适用于有通用解决方案时可以(相对 )轻松 Build 创建核心AI 解决方案使用 in- 房屋能力 购买 合作伙伴 优点 完全控制数据,从而实现长期IP和潜在的货币化可扩展 缺点 数据只有在可以访问的情况下才有价值 ,并且是独一无二的,需要内部技术专长 昂贵,如果只适用于小单位 优点 可能定制 随着技术的发展而升级处理软件、API或使用 与已经具备能力的 更快的执行 企业的关键决策是什么? 缺点 不适合高度定制的应用程序可能与供应商关系/IT相关 开放源代码 供应商合作 缺点 对第三方的依赖,特别是如果软件是集成的 聚焦:金融服务中生成AI的新生用途 前台办公室 Operations 风险管理 1.数据分析 投资分析、研究 •积极主题投资的评估模式 流程优化 •分析和优化流程和成本 •通过分析多个来源来分析客户数据 ,例如信誉和贷款申请 模式检测 •不良贷款的动态风险评估和预测 •发现数据中的异常以协助欺诈检测 、AML、KYC和法规遵从性 •检测复杂的支付、注册和登录欺诈行为,这些欺诈行为不符合传统的基于规则的系统 2.内容生成 研究、沟通、投资者关系、销售说明 •个性化产品、服务和营销 •量身定制的产品,如机器人顾问、定制报告 编码支持 •为原型(例如支付系统)和测试生成示例代码,然后开发人员可以完善 •以多种旧式语言简化广泛的IT系 统 合规报告 •提取相关信息并生成合规报告 •通过创建合成数据来改进底层算法来增强功能 3.客户服务,支持自动化/增强支持 •过滤非结构化呼叫,电子邮件,聊天等,以类似人的方式(自助服务 )或通过人工代理直接审查和响应 •“自主金融”,预测和满足客户的需求,并通知他们潜在的问题 •通过包含情感识别工具来增强 数据检索 •聊天机器人让员工和客户快速访问嵌入在CRM、政策/人力资源系统、数据库中的数据 Monitoring •实时交易(如结算)监控 •确保与客户的互动合规 I.应用生成AI的实用指南 1.技术与数据 2.Governance 3.People 负载平衡器:减震器数据湖(例如PineCone): 油箱,存储LLM用于生成响应 的原始数据 用户界面(UI):车把和仪表板 集成和中间件:驱动链,连接组件 大型语言模型( LLM)例如GPT -4):引擎 1.技术和数据:你可能需要什么基础设施?类比 像LLM这样的应用需要适应系统,就像发动机适应摩托车一样 API:排气系统,允许模型与环境交互 图片来源:VolkanOlmezUnsplash 云平台:道路应用:车轮 语言模型集成框架(例如LangChain) :齿轮箱,管理LLM和应用程序之间的交互 1.技术和数据:重大选择,包括您甚至需要GenAI吗? 对于定义明确的任务,传统的基于规则的预测性AI通常比生成AI更便宜,更快,更易于解释;生成AI更适合于涉及非结构化数据和类似人类的创造力的开放式任务 您的用例 如果您有内部专家,则培训或开发专有模型;如果没有,请找到合作伙伴私有云或内部部署 私有云或内部部署开源或 专有模型 传统云开源或专有模型 No No No 私有云或内部开放源代码/专有模型 专有数据 敏感数据 生成AI •对非结构化数据进行分类,创建新内容,识别对象 例如:情感分析信息提取,搜索图像识别 情感分析写作和编码总结 Q&A(如客户服务机器人) 注释和定义 1.高质量的数据往往是企业面临的最大挑战 2.传统云:从第三方提供商(例如AWS,Azure,GoogleCloud)租用