您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[capgemini]:生成人工智能:人工智能的下一章 - 发现报告
当前位置:首页/行业研究/报告详情/

生成人工智能:人工智能的下一章

信息技术2023-10-15-capgemini郭***
生成人工智能:人工智能的下一章

GENERATIVEAI 下一章的人工智能 FOREWARD 虽然我们观察到在组织和行业中大量采用了生成性AI,但几乎所有(96%)的高管都将生成性AI作为各自董事会讨论的热门话题1这个话题并不新鲜。 生成AI的兴起是AI整体演变的一部分——从ML和DL爆炸到大型模型的成熟——导致AI变得更加强大、可扩展和可访问。 下一代AI在这里,推动了激进的业务转型。从内容生产,工作流程到产品创新,它正在彻底改变我们创建,交互和协作的方式,同时彻底改变我们看待AI的整体方式。 当我们观察到周围前所未有的热情时-74%的高管认为 生成人工智能的好处大于相关风险2道德对于组织在其数据价值链中成功和负责任地实施生成性人工智能来说更加重要,因此绝对不应该被视为马车上的第五个轮子。 预期的好处是巨大的,作为一名业务领导者 ,了解生成型人工智能如何改变你的组织运作方式是必须的。 EverestGrop的这份报告探讨了生成人工智能的真正价值在哪里,考虑了潜在的陷阱,并分享了需要优先考虑的关键领域。就像任何数据和人工智能主题一样,组织应该通过建立正确的基础,包括强大的测试和信任层,开始处理生成人工智能的方式。毫无疑问,如果根据组织的具体情况量身定制,并使用安全,隐私保护和可靠的大规模生成解决方案构建,则得出的结果将超过风险。 如果您想继续讨论并了解更多有关如何帮助为自己的目的定制生成AI的信息,请联系 马克·奥斯特 Capgemini企业全球领导者定制生成 1,来源:凯捷研究院,利用生成式AI的价值:各行业的顶级用例 生成AI:人工智能的下一章 VishalGupta,副总裁 PriyaBhalla,实践总监 版权所有©2023,EverestGlobal,Inc.保留所有权利。 本文档已授权凯捷 Contents Introduction03 AI:旅程如此远04 GenAI-炒作是怎么回事?05 gen的真正价值AI08 潜在的陷阱-GeneralAI不是10 一张玫瑰花床 建立一个坚固12 genAI堆栈 结论和方式向前14 3 Introduction 自1956年概念化以来,人工智能一直是一项非凡的技术,彻底改变了行业 ,重新定义了 人机交互。该技术突破了界限,并在数字空间中发现了新的前沿。如此显著的突破之一,吸引了研究人员、创新者、企业和个人的想象力,就是geerAI。使用复杂的神经网络,GeeralAI模型以各种形式和方式开发新内容,例如文本,图像,音频,视频,代码等。 在这份报告中,我们研究了人工智能的出现,追踪它的起源和迷人的创新,直到一代人工智能的出现。然后,我们探索技术的能力,挑战以及它带来的变革机遇。随着GeAI的应用在各个行业中不断扩展,并且能够产生类似人类的内容并模仿人类的创造力,探索它对我们的社会,经济和日常生活可能产生的深远影响变得至关重要。 该报告认识到,尽管这项技术具有巨大的前景,但它也具有固有的风险,例如对数据隐私,身份盗窃和错误信息的担忧日益加剧。此外,随着人工智能生成的内容与人类生成的内容变得越来越难以区分,对其后果的问责成为一个紧迫的问题。通过正面应对风险和挑战并采用行业最佳实践,企业可以释放GeeAI的真正潜力,同时以道德和负责任的方式整合这一开创性技术。 AI:迄今为止的旅程 约翰·麦卡锡(JohMcCarthy)于1956年首次使用人工智能一词,但AI在1927年的一部名为Metropolis的电影中首次出现,该电影以人类机器人为特色。这个最初的虚构想法引发了一系列的进步,这些进步导致了当今AI历史上最先进的发展,geAI可以创造自己的虚构角色和故事。值得注意的是,旨在增强人类能力的技术现在可能会接管人类传统上执行的大量任务。但人工智能并没有在冲刺中达到这个阶段;这是一个漫长而具有挑战性的旅程,涉及大量投资,无数不成功的试验和突破性进展。 图表1概述了人工智能开发、创新和采用的各个阶段。 EXHIBIT1 旅程中的里程碑 实验 约翰麦卡锡硬币的术语 AI在 达特茅斯学院夏季AI会议( 1956年) Enablement 随着AWS、GCP和Azure 的推出,云计算的诞生 富集 OpenAI推出 ChatGPT(2022) 快速的企业采用;深度 学习和GeneralAI的显著突破 处理能力和计算能力的进步, 实现更复杂的AI算法 ML的兴起与AI基础技术的探索 1900 2000年初 2015年及以后 来源:珠穆朗玛峰集团(2023年) 时间线 数据和计算的传播 人工智能一词在首次出现后成为当时的流行语。然而,人工智能的发展直到20世纪60年代末才真正开始,因为还没有 必要的计算能力和数据,因此,大部分工作都围绕着人工智能的数学。在20世纪60年代和70年代,人工智能技术如 ML,NLP和计算机视觉被建立,为人工智能进入我们的日常生活奠定了坚实的基础,为其广泛采用铺平了道路。 21世纪初是人工智能取得重大进展的时期。一个繁荣的生态系统出现了,支持AI基础设施。计算能力、存储和网络技术的进步促进了用于训练AI模型的大量数据的处理。2006年云计算的诞生是人工智能发展的催化剂。硬件方面的重大改进 ,例如为AI工作负载开发了强大的处理器、GPU和专用芯片。这一时期也标志着AI初创企业蓬勃发展的生态系统的出现。 人工智能的开发和采用从2015年开始快速进行。算法和软件工具的显著改进,如开源人工智能软件TensorFlow和PyTorch的推出,使开发人员更容易构建和扩展人工智能应用程序。这些发展,再加上云计算带来的动态计算能力,使企业加快了人工智能的采用。 在过去的十年中,企业和消费者都对AI越来越满意。事实上,人工智能深深植根于我们的日常生活中,几乎不可能想象一个没有它的世界。人工智能的使用也在企业中显著扩大。根据EverestGrop的2023年人工智能调查,96%的企业已经在一个或多个业务中成功实施了人工智能。 在最长的时间里,AI可以执行重复的任务,例如识别模式或识别对象。随着OpenAI于2022年11月30日推出ChatGPT,这种情况发生了变化。ChatGPT是一款AI驱动的聊天机器人,可以在无标签文本的大型数据集上进行训练,以生成类似于人类的输出。接下来,我们将检查其功能。 GenAI-炒作是怎么回事? 世界上最大和最有价值的企业要么正在谈论generAI,要么已经开始为其实施奠定基础。OpenAI研究员IanGoodfellow在2014年创造了生成AI一词。EverestGroup定义GenAI是一个AI领域,可以创建,操纵和合成以前以各种形式和方式不存在的新内容。 多亏了ChatGPT,它使AI的使用民主化,并从根本上改变了消费者搜索内容的方式,该类别的趋势超过了整个AI 市场。聊天机器人已将早期技术创造者所熟悉的AI置于消费者手中。 但是,对于ChatGPT和genAI这两个术语的同义词使用,必须要小心。虽然genAI是一个具有生成能力的AI领域 ,但ChatGPT是一个genAI应用程序。在我们探讨genAI的商业和应用方面之前,了解AI之间的差异至关重要,因为 我们今天知道它(也称为决策AI)和颠覆性的下一代AI。 ? 图表2显示了GenAI模型与传统ML模型的区别,并列出了它们的输入/输出功能: 附件2 决策AI与通用AI:一种比较观点 来源:珠穆朗玛峰集团(2023年) 参数决策AIGenAI 培训可以在较小的数据集上进行训练 参数参数较少 需要具有指数级高数量的训练参数的大型数据集 培训时间和费用 相对便宜的培训和部署 相对快速的训练 培训和部署成本高 获取大量高质量数据集的高成本 显著延长训练时间 计算和基础设施可以在标准计算基础架构上进行培训和运 行 需要专门的硬件,如GPU和TPU 能力提供预测或分类基于现有数据 执行对其进行培训的特定AI应用程序 生成能力-图像和视频合成,文本生成,语音合成,代码生成等。 能够执行多个AI任务的通用模型 传统ML模型和GeerAI模型之间的根本区别在于训练参数的数量。由于高质量培训数据和硬件容量的可用性增加,这是该领域的两个最大制约因素,因此这种培训成为可能。例如,训练大型图像模型需要数百万个高质量标记图像的数据集,而训练ML分类器来识别图像中的特定对象可能需要数千个标记示例的数据集。 训练参数数量的增加是模型复杂性增加和模型执行更广义任务的能力的指标。然而,为没有目的定义的任务而训练的基础geeAI模型是在极高数量的训练参数上训练的,需要专门的资源。迄今为止,由于其复杂性和资源需求,只有大型科技巨头一直在开发基础代AI模型。然而,在开发更好的AI模型的竞争中,质量被证明比数量更重要。定制一代AI模型是为特定任务而设计的,并在较小但有针对性的数据集上进行训练,在市场上获得了很高的吸引力。 图表3显示了随着时间的推移推出的突出大型模型及其训练参数大小。 附件3 ML模型的演变 来源:斯坦福大学AI指数2023年度报告1珠穆朗玛峰集团分析 FoundationgenAI模型 自定义genAI模型 吴道2.0 PaLM GPT-4 威震天-图灵 PanGu-δ 密涅瓦 GPT-3 HyperClova 地鼠侏罗 纪-1 chinchilla OPT 布卢姆 GPT-3 LaMDA2 GLM YaLM T5-11B 图灵前起落架 字母码 LLaMA BloombergGPT GPT-NeoX Parti DALL-E Codex ESMFold Flan-UL2 StarCoder 威震天GPT-J 侏罗纪-X T5-3B ERNIE3.0 CogView 达尔·E2 AlexaTM 羊驼 DALL-E2 GPT-Neo LaMDA1吴道 Grover-Mega ERNIE GPT-2 稳定扩散1.0 稳定扩散2.0 2019年起 时间线 1,00,00,000 训练参数的数量(单位:百万)对数基数10 10,00,000 1,00,000 10,000 1,000 100 注意:该表示并非详尽无遗,涵盖了具有公开披露数量的训练参数的大型模型 有趣的是,它采取了元2405万美元用于开发其65B参数大语言模型(LLM)LLaMA,该模型使用2048NVIDIA进行训练3A100GPU。成本体现了开发GeeralAI模型所需的大量资源,特别是在广泛的计算方面。虽然技术的进步和高级数据集的可用性可能有助于降低开发成本,但开发生成模型的成本预计仍将比传统ML模型高得多。考虑到OpeAI的GPT模型,该模型是在10,000个这样的GPU上训练的,人们只能想象所涉及的规模和相关成本。随着这项技术的好处和潜力不断消失,这项投资本身对改变行业和释放人工智能领域的新可能性有着巨大的希望。 1斯坦福大学人工智能指数2023年度报告 2元研究 3NVIDIAGPU定价 genAI的真正价值 GeeAI的成功和采用取决于几个关键因素。虽然我们相信这项技术将在未来对每个行业产生影响,但一些行业的定位是比其他行业更快地采用这项技术。EverestGrop试图通过分析四个参数——当前数据可用性、技术准备、监管和合规要求以及各行业内容的重要性,来了解这些行业对采用新一代AI的准备情况。 我们的分析表明,媒体和娱乐(M&E),专业服务,零售和消费品(RCG),银行,金融服务和保险(BFSI)以及旅行和运输都处于优先采用该技术的有利位置。例如,RCG公司多年来一直是以消费者和产品为中心的数据的数据库,并且一直处于技术采用的最前沿,拥有强大的数据和基础设施基础。此外,尽管每个行业对法规和合规性都有一定程度的敏感性 ,但RCG的法规却少于其他行业。 其他垂直领域的几家企业也开始尝试GeneAI。例如,旅行预订公司eDreamsOdigeo与Google合作,实施其GeneAI功能以个性化客户互动,而西门子与