生成式AI模型—业务中的风险和潜在回报 什么ChatGPT的崛起,达尔•E2,Bard等人可能对您的组织意味着什么。 毕马威国际 生成式AI模型—风险和潜在回报业务 ©2023版权归一个或多个毕马威国际实体所有。毕马威国际实体不向客户提供任何服务。保留所有权利。 2023年4月 丽莎Heneghan 全球首席数字官毕马威国际 生成式AI模型突出了技术的力量。它们有可能使我们更有效率,并且可以使我们在某些方面做得更容易 。但是,这些模型具有所有组织和个人都应注意的风险影响。也就是说,我们不能忽视这些模型。 它们正迅速成为我们日常个人和职业生活的一部分。我们需要确定如何拥抱它们-但要安全。 本文的封面图片和图像均使用DALL设计•E2,一个基于文本描述创建图像的AI艺术生成器。封面图片的图像提示是:流畅的抽象,蓝色和紫色的波浪列,飞溅,水滴,紫色背景。 而达尔•E2生成引人入胜的视觉内容,它没有接受过毕马威品牌指南的培训。此外,它既没有人类的专业知识,也没有独创性来理解毕马威的品牌定位。因此,这些图片被视为品牌外,仅供说明之用,并经毕马威全球品牌特别许可。 生成式AI模型—业务中的风险和潜在回报2 ©2023版权归一个或多个毕马威国际实体所有。毕马威国际实体不向客户提供任何服务。保留所有权利。 执行概要 04 市场概述 05 生成的人工智能模型是什么? 06 生成的人工智能模型如何工作的呢 06 潜在的机会和用例 07 目前考虑 10 ,未来将会是什么? 13 毕马威(KPMG)如何帮助 14 联系人 15 GeGneenreartaivteiveAIAmImodoedlesls--商业风险和潜在回报 3 ©2023版权归一个或多个毕马威国际实体所有。毕马威国际实体不向客户提供任何服务。保留所有权利。 内容 0执行概要 我们相信,生成式人工智能(AI)模型有可能通过以前所未有的速度和而且安全。如果您正在考虑使用生成式AI,请务必建立一套内部 效率自动化和执行某些任务来改变业务。当人类的专业知识和独创性与流程和控制措施,供组织中的每个人都遵循。对如何使用这些程序并有效利用其能力的深刻理解相结合时,尤其如此o在本报告中,我们将介绍潜在的用例和机会,以及如果您正在考虑在组 织内使用ChatGPT等生成式AI应用程序,应考虑的事项。 然而,需要时间和人类专业知识才能以负责任、值得信赖的方式释放他们的全部潜力。 以下是您应该了解的有关生成式AI的10件事: 1 最常见的生成式AI解决方案大致可分为五类:内容生成器,信息提取器,智能聊天机器人,语言翻译器和代码生成器。 生成式AI模型可以汇总文章、起草电子邮件并生成图像和视频。由人类训练,一些生成式AI模型具有对话技能,例如,回答后续问 2题,承认错误,挑战不正确的假设以及过滤或拒绝不适当的请求。 ChatGPT是一个根据人类指令训练的聊天机器人。其最初的底层大型语言模型GPT-3.5有1750亿个参数,并使用超过100万个数据集或5000亿个标记(单词或单词片段)进行训练。GPT-3.5没有连接到互联网,并且从2021年9月开始接受数据训练。GPT-4 3是OpenAI新的大型多模态模型,是从其早期的大型语言模型演变而来的。 生成式AI模型已用于各种业务功能,从IT、人力资源和运营到财务、审计、法律和营销。合适的应用程序包括起草提案、开发和 测试代码以及提取和汇总复杂信息。 4 生成式AI采用数据输入或参数来学习和构建知识。除非您明确限制应用程序提供商这样做,否则该数据可能会用于回答其他人的提示,从而可能向公众公开组织的专有信息。根据应用程序的不同,您可能还会签署您的版权。参考相应的条款和条件可能会让您了解用户输入的数据会发生什么情况。 5 根据您使用生成式AI的目的和实施方式,您的活动可能会暴露知识产权或商业机密,并使组织面临欺诈风险。重要的是要保持警惕,并确保您的组织不会以违反适用法律(包括隐私法)、客户协议或专业标准的方式使用AI。 将人工智能生成的信息或代码复制到任何可交付成果或产品中可能构成版权或其他知识产权侵权。这可能会对您的组织造成法律和声誉损害。 fb 我们预计,生成式人工智能的开源和精品版本将继续集成到许多常见的应用程序、系统和流程中,从互联网浏览器到组织许可的人工智能连接技术,例如基于云的软件和即时消息程序。 在组织内创建安全使用指南是帮助确保正确有效地使用生成式AI应用程序的关键。您的组织还应该提高员工的技能,因为循环中的人类带来了独特的见解和理解,这是仅靠生成式AI无法复制的。 7毕马威采取负责任的方法,以安全、可信和合乎道德的方式设计、构建和部署人工智能系统。这种方法可帮助公司加速为消费者、组织和社会创造价值。 8 9 10 根据研究和咨询公司Gartner的数据,到2025年,来自大型组织的出站消息中有30%将是合成生成的。1毕马威(KPMG)于2022年9月在美国发布的《人工智能风险调查报告》中,85%的受访者预计人工智能和预测分析模型的使用将会增加。此外,在2022年毕马威美国技术调查中,一半的受访者表示他们已经看到了人工智能技术投资的投资回报率。 生成式AI模型在2022年夏天引起了人们的注意,当时AI生成的图像赢得了一场艺术比赛。211月,在ChatGPT推出后,他们再次成为人们关注的焦点。然而,正是在2023年1月的世界经济论坛会议上,微软董事长兼首席执行官萨蒂亚·纳德拉表示,“人工智能的黄金时代”正在进行中,3围绕ChatGPT的嗡嗡声确实开始加剧,产生了许多来自毕马威成员所客户的问题和对话。 训练这些模型需要大量的风险投资、人力和计算能力。ChatGPT的创建者OpenAI从微软获得了10亿美元。4以及该公司在2023年初的另一笔多年、数十亿美元的投资,5和谷歌6和元7创建了自己的生成式AI模型 。考虑到可能的应用范围,整个行业都在建立使生成AI模型有用。 生成式AI应用程序大致可分为五类:内容生成器,信息提取器,智能聊天机器人,语言翻译器和代码生成器: •内容生成器:生成式预训练转换器工具生成博客文章、电子邮件、社交媒体文章、图像、Web副本和广告等内容的地方。 •信息提取器:这些应用程序可以创建新闻文章、博客文章、法律文档等的简短和长格式摘要。一些公司使用它们来开发和分析法律文件 。 •智能聊天机器人:公司越来越多地使用智能聊天机器人作为消费者助手。聊天机器人以对话方式进行交互,可以回答后续问题、承认错误、挑战不正确的想法并拒绝不适当的请求。 •语言翻译:可以翻译多种语言的多语言工具。他们有可能构建整个网站界面,包括翻译网站。 •代码生成器:生成式AI模型可以将自然文本输入转换为代码片段或应用程序。通过基本描述或小程序函数输入,这些模型可以生成各种编程语言的代码,并识别和修复错误。 02市场概述 1Gartner,将彻底改变销售的7项技术中断,2022年10月10日。HTtps://www.gartner.com/en/articles/7-technology-disrup-tions-that-whole-change-sales。GARTNER是Gartner,Inc.和/或其附属公司在美国和国际上的注册商标和服务标志,经许可在此使用。保留所有权利。 2https://www.smithsonianmag.com/smart-news/artificial-intelligence-art-wins-colorado-state-fair-180980703/3https://www.weforum.org/press/2023/01/satya-nadella-says-ai-golden-age-is-here-and-it-s-good-for-humanity4https://openai.com/blog/microsoft-invests-in-and-partners-with-openai5https://blogs.microsoft.com/blog/2023/01/23/microsoftandopenaiextendpartnership/6https://blog.google/technology/ai/bard-google-ai-search-updates/ 7https://ai.facebook.com/ 生成式人工智能是指可以生成内容的人工智能,而不是简单地分析或处理现有数据。 生成式AI模型(如GPT-4)是在一组整理的数据上构建和训练的。他们可以是建立在预定义数据收集上的通才或专家,旨在生成有助于实现某些人为导向请求的输出。 例如,一些模型可以根据以前的短语预测下一个单词,或者根据之前图像的描述预测下一个图像。 此培训能够快速生成原始内容,包括文本、图像、视频和代码。随着减少由于需要人力资源,一些公司希望能够以更快的速度和更低的成本制作内容,从而有机会创建以前过于昂贵或耗时的新型内容。这 从根本上改变了人机交互,并打开了无数潜在的用例。 这种预测功能使模型能够进行分析。例如,它们可用于标识与输入文本描述的主题相关的文档。 0生成的人工智能模型如何工作的呢 生成式AI模型旨在根据一组清晰的输入和规则生成内容。 最近关于生成AI模型应用最热门的是ChatGPT,这是一个由旧金山研究实验室OpenAI创建的人类指令训练的聊天机器人。8的 2023年3月14日,ChatGPTPlus订阅者能够使用GPT-4,这是一种大型多模态模型(LMM),可接受图像和文本输入并生成文本输出。9在 2023年3月23日OpenAI为ChatGPT推出了插件,包括自己的网页浏览插件。这意味着ChatGPT现在可以访问某些第三方来源和数据库。10 ChatGPT代表C帽子(conversation-based)G(生殖)P(pretrained)T(变压器) 。它通过从人类反馈中强化学习进行微调,其中训练代表人类偏好的奖励模型,以帮助使输出听起来更人性化,防止不良反应并尽量避免幻觉(编造事实)。 ChatGPT是作为大型语言模型(LLM)创建的,此后已发展成为一个大型多模态生成AI应用程序。这意味着应用程序现在可以 接受图像和文本输入,而不是像以前那样只接受文本输入。结合使用无监督学习来预测结果的神经网络模型,这种类型的生成模型可以确定最有可能的语言模式以及它已经吸收的内容之间的关系。 “大”是指模型所基于的数据量,以及模型本身的大小,并涉及使用大量可公开访问的电子文档来训练它们。例如,当它 于2022年发布,ChatGPT拥有1750亿个参数(控制机器学习模型行为的值——参数越大,模型的分析能力就越强)。 它最初是用超过100万个数据集或5000亿个代币(单词或单词片段)训练的,包括来自维基百科和纽约时报。要把它放进去 透视,人类平均一生说8.603亿字,11制作这个集合-或AI术语中的“语料库”-相当于300年的语言。 03生成的人工智能模型是什么? 8https://www.forbes.com/sites/cindygordon/2023/02/02/chatgpt-is-the-fastest-growing-ap-in-the-history-of-web-applications/?sh=7510d916678c 9https://openai.com/research/gpt-410ChatGPT插件(openai.com) 11https://openlibrary.org/books/OL3502128M/The_joy_of_lex ChatGPT的基本版本未连接到互联网,并且在2021年9月之前接受了在线材料的培训,这意味着它的知识不是最新的。向少数高级开发人员发布的较新实现,例如必应搜索引擎的插件,12已连接到互联网并