1 前言 在人工智能发展的漫长历程中,如何让机器学会创作一直被视为难以逾越的天堑,“创造力”也因此被视为人类与机器最本质的区别之一。然而,人类的创造力也终将赋予机器创造力,把世界送入智能创作的新时代。采用机器学习的新范式赋能业务不断探索已经播种了几十年,但随着足够的可伸缩算力的就位、海量数据的爆炸,以及机器学习技术的快速进步,各行各业的客户开始对业务进行重塑。最近,智能对话类型的AIGC应用引起了广泛的关注,引发了诸多想象。我们正处在一个机器学习被大规模采用的转折点上,我们也相信人工智能将会重塑大量客户体验和应用程序。从机器学习到智能创造,从专业生产内容(PGC,Professional-generatedContent),用户生产内容(UGC,User-generatedContent)到人工智能生成内容(AIGC,AI-generatedContent),我们见证了一场深刻的生产力变革,而这份变革也开始影响到我们工作与生活的方方面面,AIGC也慢慢的演变成了一场技术和艺术碰撞的盛宴,不断释放人类创造力,提高艺术设计领域的数字化创新效率。 2 本白皮书将结合AIGC领域最新技术趋势和真实行业客户案例,向所有AIGC的决策者,开发者、创业者和使用者展示AIGC给各行各业带来的创新与变革,帮助用户更好的理解AIGC带给企业的价值,以及如何借助亚马逊云科技的产品和服务快速高效地构建差异化的AIGC应用,增强企业在AIGC时代的敏捷性与竞争力。 目录 4 篇章一 篇章二 AIGC介绍与典型行业应用场景介绍 8 AIGC技术生态与典型客户需求 篇章四 篇亚马章逊三云科技AIGC技术能力与解决方案10 23 AIGC客户案例分享 扫码或点击了解更多亚马逊云科技 3 AIGC技术能力与解决方案 篇章一 A行IG业C应介用绍场与景典型 Gartner将生成式AI列为最有商业前景的人工智能技术之一。根据其发布的2022年人工智能技术成熟度曲线,预计生成式AI将在2-5年内进入生产成熟期,发展潜力与应用空间巨大。2025年,30%大型组织对外消息将由生成式AI生成。2025年,50%的药物发现与研发将使用生成式AI。2027年,30%的制造商将使用生成式AI提高产品研发效率。从数字内容生产,到引领产业变革,商业前景,加速产业融合与变革。 A能IG技C术(生成式人工智能)是指可生成全新内容的人工智 从字面意思来看,AIGC是继PGC,UGC之后的新型内容创作方式,可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势,打造新的数字内容生成与交互形态。 人工智能,可为现实 世界的任务制作足够 接近人类生成内容的 原创内容 由大量数据预先 训练的基础模型 驱动 只需微调,即可用 于特定领域自定义 任务 降低机器学习模型开发的时间 和成本,提升效率,加速创新 因此,AIGC的狭义概念是利用人工智能自动生成内容的生产方式。但是AIGC已经代表了人工智能技术发现的新趋势,过去传统的人工智能偏向于分析能力,即通过分析一组数据,发现其中的规律和模式并用于多种用途,比如应用最为广泛的个性化推荐算法。而现在的人工智能正在生成新的东西,而不是仅仅局限于分析已经存在的东西,从而实现了人工智能从感知理解到生成创造的跃迁。广义的AIGC可以看作是像人类一样具备生成创造能力的人工智能技术,即生成式人工智能,它可以基于训练数据和生成算法模型,自主生成创造新的文本、图像、音乐、视频、3D交互内容(如虚拟人、虚拟物品、虚拟环境等)等各种形式的内容和数据,以及包括开启科学新发现、创造新的价值和意义等。因此,AIGC已经加速成为了人工智能领域的新疆域,推动人工智能迎来下一个时代。 4 AIGC,生成式AI(GenerativeAI) 与基础模型(FoundationModels) 适用于文本摘要、问答、数字艺 术创作、代码生成等多种用例 与所有人工智能技术一样,AIGC的能力由机器学习模型提供,这些模型是基于大量数据进行预先训练的,通常被称为基础模型(FoundationModels)。机器学习的最新进展(特别是基于transformer的神经网络架构的发明)直接带来这一类模型的爆发式增长,这类模型通常包含数十亿个参数或变量。如今的基础模型,例如大型语言模型GPT4或BLOOM,可以执行跨多个领域的多种任务,例如撰写博客文章、解决算术问题、对话聊天、基于文档回答问题等,由stability.ai开发的文生图模型StableDiffusion,可以生成创意图片,转换已有图像风格等。 尽管预训练基础模型所带来的功能和可能性已足够令人惊叹,而真正让业界兴奋不已的是,这些通用模型也可以被定制化加工,执行专属于其业务领域的特定功能,帮助业务建立差异化竞争优势,与从零开始训练模型相比,仅需使用一小部分数据和计算资源。定制化的基础模型可以带来独有的顾客体验,体现公司的观点、风格和服务,适用于众多消费者行业,如金融银行、旅行和医疗等。例如,一家金融公司如果需要使用所有相关交易自动生成活动日报以供内部流通,它可以使用包括既 AIGC基础模型的主要使用方式 往报告在内的专有数据来定制模型,以便基础模型了解如何阅读报告和使用哪些数据来生成日报。 但是,基础模型也有一些挑战,包括计算成本高和数据偏差等问题。 计算成本是基础模型的一个主要挑战。由于这些模型具有数十亿个参数,因此它们需要大量的计算资源才能进行训练和推理。对于中小型企业来说,从0到1训练自己的基础模型非常困难,而且在推理时也需要多个GPU进行计算,因此运行成本非常高。另一个挑战是数据偏差。由于基础模型是在互联网上的未经筛选数据上进行预训练的,因此这些数据可能包含偏见、仇恨言论等有害信息。即使有人工标注员,也难以检查每个数据点,因此这可能导致基础模型的信任度不高。 尽管存在这些挑战,基础模型的发展仍然是一种重要趋势,它可以提高自然语言处理领域的效率和灵活性。将来,我们可能会看到更多的基础模型应用于各种任务和应用程序,从而推动人工智能技术的进一步发展。 5 5 已有基础模型的提示词工程(PromptEngineering) 模型微调(Fine-tuning) 预训练(Pretraining) 训练时长和成本 不需要 几分钟到几小时 数天,数周到数月不等 定制化 ▪不需要定制化模型▪需要定制化提示词 部分 ▪针对特定任务优化▪增加特定的私域训练数据集 完整 ▪模型架构与大小▪文本长度▪词汇量▪训练数据集 专业程度 低 中 高 AIGC典型应用场景与行业分布 按照模态区分,AIGC又可分为音频生成、文本生成、图像生成、视频生成及图像、视频、文本间的跨模态生成,细分场景众多,其中跨模态生成值得重点关注。 AIGC塑造数字内容生产与交互的新范式 伴随数字技术与实体经济的深度融合、互联网企业数字化场景拓展至元宇宙,人类对数字内容的总量和丰富程度的需求不断提高,AIGC作为当前重要的内容生产方式,已率先在游戏、营销、电商、传媒、影视娱乐等领域取得进展,伴随AIGC在 各个行业的渗透,AIGC作为AI数字商业的探路者,有望开启下一场数字商业模式的新篇章。 6 6 生成图片 媲美专业画师的精美图片 stability.ai,Midjourney,OpenAI,RunwayML,Tiamat 生成文字 人机交互、写邮件、写广告、剧本和小说 ChatGPT–对话形式人机交互;Copy.ai-广告和营销文案; Jasper.ai-营销推广文案及博客 生成音频 人工智能作曲&编曲、人工智能音乐生成、人工智能演 唱、声音克隆人工智能音乐团队Amper,人工智能播客 Podcast.ai,灵动音科技,行者人工智能 生成视频 文字生成视频、视频内容创作、动态面部编辑、画质增强修复 Make-A-Video(Meta),ImagenVideo(Google),Phenaki (Google),Synthesia,HourOne 7 AIGC主流行业实践与典型应用场景 游戏 聊天机器人、游戏原画设计、场景生成、游戏策略生成、 BGM生成、IP角色生成; 零售电商 风控欺诈检测、商品3D模型、虚拟主播、虚拟货场、 智能商品详情、商品个性化图案设计; 广告设计 创意辅助、包装设计、服装设计出图、品牌宣传视频 生成、营销素材生成、营销文案配图; 金融领域 智能投顾、智能客服、个性化营销文案、产品风险与客 户信用评估、行业研究报告生成; 媒体娱乐 视频游戏生成、AI生成虚拟人头像、自拍图片风格生成、 剧本设计、特效制作、影视作品配乐; 医疗健康 医学影像分析、健康数据分析、药物研发、个性化治疗 医护陪伴、心理治疗; 应用程序 基础模型 基础设施 AIGC技术生态 用户 端到端应用程序 面应专用有程基序础,模使型的用示例: 面向最终用户的B2B和B2C应用程序,没有专有基础模型 应用程序 示例:Jasper、GithubCopilot 闭源基础模型 模型中心 Midjourney、 通过API公开的大规 示例:HuggingFace、Replicate 共享和托管模型的平台 Runway 模预训练模型 示例:GPT-3(OpenAI) 开源基础模型 示例:StableDiffusion(stability.ai) 发布训练参数权重的模型 示例:GPU(Nvidia)、TPU(Google) 计算硬件 专为模型训练和推理工作负载优化的加速器芯片 AmazonWebServices、GCP、Azure、Coreweave 云平台 示例:在云端部署向开发人员开放的基础硬件 篇章二 典AIG型C客技户术需生求态与 AIGC技术生态 AIGC技术生态加速形成与发展,目前整个AIGC应用的技术生态大致可以分为 三层:分别为基础设施、基础模型和应用程序。 AIGC技术生态: 成领域独角兽 •通过运行自己的基础模型管道或者依赖第三方基础模型API,把AIGC基础模型以端到端的方式为客户提供服务和产品,比如炙手可热的人工智能文本生 Jasper.ai,提供营销文案生成的SaaS服务如广告文案、博客、外发邮件等,人工智能绘画软件Midjourney等; •为AIGC应用提供支持的基础模型,可以通过闭源专有API(如GPT-3)或开源模型(如StableDiffusion),或者提供开源模型托管平台(如HuggingFace); •提供AIGC基础模型进行训练和推理所需的算力基础设施(云计算服务商和硬件制造商),如亚马逊云科技,英伟达等; 图片来源:A16Z:who-owns-the-generative-ai-platform/ 8 8 需要注意的是,我们讲的并不是整个市场的生态图,而是一个分析市场的框架,本文在每个类别中都列出了一些知名厂商的例子,但没有囊括目前所有最先进的AIGC应用,也没有深入讨论MLOps或LLMOps工具,因为现在还没有达到完全成熟的标准化,有机会我们会继续讨论。 AIGC应用构建者和使用者的主要需求 基础模型提供商 (ModelProviders) 使用基础模型调优提供服务的厂商 (ModelTuners) 直接使用基础模型厂商 (ModelConsumers) 技术门槛高,需要大量的金 钱和时间成本 与AIG典C型基客础户模需型求生态 数据准备 ▪数据规模大 ▪数据质量参差不齐 基础模型产业化所面临的主要技术挑战: 作为云服务提供商,亚马逊云科技专注于为基础模型开发者和使用者提供全面、可靠、安全的工具与服务,助力AIGC应用开发加速与成本优化。基于此,我们将基础模型生态的主要参与者分为三类:基础模型提供商(ModelProvider),使用基础模型调优提供服务的厂商(ModelTuner)和直接使用基础模型厂商(ModelConsumer),我们总结的每一类用户的需求和面临的主要挑战如下: