区块链 AIGC——Web3时代的生产力工具 在我们《元宇宙(七):虚拟人的“灵魂”是什么?》的报告中,提到了虚拟人的灵魂来自于AI自主创作内容。同时,元宇宙更倾向于开放世界游戏,AIGC内容生成方式的创新将成为Web3时代全新的生产力工具。 AIGC(AI-GeneratedContent人工智能生成内容)代表新一轮范式转移的开始。近期,硅谷的众多一线VC们开始将目光瞄准AI初创公司,尤其是生成式AI艺术这一领域。今年有两家独角兽Stability和Jasper均获得了超过一亿美元的融资,估值 突破十亿美元。AIGC赛道火爆不仅得益于技术进步、商业应用广泛和需求增长,还归功于该赛道还处于早期。虽然大型科技公司捕获了大量价值,初创企业仍有机会突破。 AIGC将是Web3时代的生产力工具。当我们迈入Web3.0时代,人工智能、关联数据和语义网络构建,形成人与网络的全新链接,内容消费需求飞速增长。UGC\PGC这样的内容生成方式将难以匹配扩张的需求。AIGC将是新的元宇宙内容生成解决方 案。AIGC的生成利用人工智能学习知识图谱、自动生成,在内容的创作为人类提供协助或是完全由AI产生内容。不仅能帮助提高内容生成的效率,还能提高内容的多 证券研究报告|行业深度 2022年11月13日 增持(维持) 行业走势 通信沪深300 16% 0% -16% -32% 2021-112022-032022-072022-11 样性。随着NLP(NaturalLanguageProcessing,自然语言处理)技术和扩散模型 (DiffusionModel)的发展,AI不再仅作为内容创造的辅助工具,创造生成内容成为了可能。由此,将来文字生成、图片绘制、视频剪辑、游戏内容生成皆可由AI替代。 AIGC技术主要涉及两个方面:自然语言处理NLP和AIGC生成算法。自然语言处理是实现人与计算机之间如何通过自然语言进行交互的手段。AIGC生成算法主流的有生成对抗网络GAN和扩散模型。扩散模型已经拥有了成为下一代图像生成模型的 代表的潜力。它具有精度更高、可扩展性和并行性,无论是质量还是效率均有所提升,其快速发展成为AIGC增长的拐点性因素。同时,在机器学习的过程中,需要通过大量的训练来实现更准确的结果,目前以英伟达A100为主,对于底层算力需求将有飞速增长。 AIGC在文字、图像、音频、游戏和代码生成中商业模型渐显。近期我们研究了国内外数十家AIGC相关企业,尤其在一些具备高重复性的任务、对于精度要求并不那么高的领域应用已逐步成熟,并在探索商业模式中。目前图片生产、文字生成较为 常见,这类AIGC服务大多数时候会以提供SaaS服务的形式变现。 AIGC未来发展核心:大模型、大数据与大算力。结合自然语言的大模型与数据集已成为AIGC发展的软件基础,OpenAI的Clip模型基于4亿组高质量的英文图文对 应数据训练而成;算力即权力将在AIGC数字时代更加凸显,StableDiffusion目前依赖于4000个英伟达A100的GPU集群,运营成本超5000万美金。为了让功能更加精确,未来还将更多地基于语种去开发垂直类的应用,便于更有目的性地为特定功能进行训练。 AIGC投资框架:软硬件与数据集。生成算法、NLP与算力决定AIGC能否运行,而高质量的数据集决定了AIGC质量与商业模式。软件层面主要包括自然语言处理技术:谷歌、微软、科大讯飞、拓尔思;AIGC生成算法模型及数据集:英伟达、Meta、 百度、蓝色光标、视觉中国、昆仑万维。算力层包括:澜起科技、中兴通讯、新易盛、天孚通信、宝信软件、中际旭创等。 风险提示:技术创新不及预期:AIGC的技术发展不及预期。以及底层硬件技术,如:超级计算机、算力的发展不及预期。政策监管风险:目前AIGC还处于相对早期,后续是否会出台AIGC作品相关知识版权或其他法律监管条款尚不明确。 作者 分析师宋嘉吉 执业证书编号:S0680519010002邮箱:songjiaji@gszq.com 分析师金郁欣 执业证书编号:S0680521070002邮箱:jinyuxin@gszq.com 相关研究 1、《通信:2022Q3综述:受益“通信+”与汇兑,利润持续修复》2022-11-10 2、《通信:通信的政策新方向—大安全、虚拟现实与数字会展》2022-11-06 3、《区块链:ZK证明计算:算力硬件的新征途?》 2022-11-04 请仔细阅读本报告末页声明 内容目录 1.2022:AIGC崛起之年3 2.AIGC是什么?5 2.1AIGC发展简史6 2.2技术6 自然语言处理技术NLP6 AIGC生成模型9 2.3当我们开始用AIGC——商业模式的探索14 3.AIGC的未来发展趋势18 3.1面临的挑战19 3.2未来的发展方向20 4.投资策略:AIGC的软硬件与数据集20 风险提示21 图表目录 图表1:红框为网站头条文章位置,为AI创作3 图表2:官网展示应用场景4 图表3:AI生成的乔布斯访谈博客4 图表4:《幻觉东京》AI重制版5 图表5:内容生成的四阶段5 图表6:AIGC发展历程6 图表7:自然语言理解三大发展阶段7 图表8:自然语言生成6步骤7 图表9:微软ApacheSpark功能8 图表10:Transformer与其他神经网络英德翻译质量对比9 图表11:Transformer与其他神经网络英法翻译质量对比9 图表12:Transformer模型结构9 图表13:GAN的两个组成10 图表14:GAN架构10 图表15:DALL-E2可以根据文字描述生成图片11 图表16:扩散模型训练原理12 图表17:扩散模型与其他模型比较12 图表18:正态分布函数叠加13 图表19:DALL-E2工作过程举例13 图表20:Jasper的应用场景14 图表21:通过AIGC撰写的AIGC报告15 图表22:通过AIGC生成的图片15 图表23:MidJourney用户案例16 图表24:Phenaki2分钟视频生成案例17 图表25:Delysium中的虚拟人玩家18 图表26:GitHubCopilot18 图表27:AIGC生成的图片在细节上效果较差19 图表28:AIGC投资标的21 1.2022:AIGC崛起之年 近期,硅谷的众多一线VC们开始将目光瞄准AI初创公司,尤其是生成式AI艺术这一领域。今年9月23日,红杉美国官网发表了一篇名为《生成式AI:一个创造性的新世界》的文章,认为AIGC(AI-GeneratedContent人工智能生成内容)会代表新一轮范式转移的开始。 2022年10月,英国开源人工智能公司StabilityAI宣布获得1.01亿美元融资,估值高达10亿美元,跻身独角兽行列,由Coatue、LightspeedVenturePartners和O'ShaughnessyVenturesLLC参与投资。StabilityAI今年发布了StableDiffusion的模型,主要用于根据用户输入的文字描述自动生成图像。StableDiffusion的诞生让AI绘画这个领域愈发火爆。最近,巴比特正式对外宣布,全面拥抱AIGC,开始规模化采用AI配图,其中头条图片,全面由AI创作。包括但不限于巴比特网站和APP,微信公众号、百家号、网易号等自媒体平台,以及微博等社交媒体账号。 图表1:红框为网站头条文章位置,为AI创作 资料来源:巴比特官网,国盛证券研究所 除了绘画以外,文字、音频、视频均可通过AI来生成。 文字:以Jasper为例,以AI文字生成为主打产品,通过其文字生成功能,用户可以生成Instagram标题,编写TikTok视频脚本、广告营销文本、电子邮件内容等工作。截止2021年,Japer已拥有超过70000位客户,并创造了4000万美元的收入。 图表2:官网展示应用场景 资料来源:Jasper,国盛证券研究所 图表3:AI生成的乔布斯访谈博客 音频:以Podcast.ai为例,作为一个由AI生成的博客,每周都会探讨一个话题。在第一期节目中,其通过乔布斯的传记和收集网络上关于他的所有录音,Play.ht的语言模型大量训练,最终生成了一段假JoeRogan采访乔布斯的播客内容。 资料来源:Podcast.ai官网,国盛证券研究所 视频:目前的AI技术不仅可以生成图片,也能够生成序列帧,如:《幻觉东京》。经过160小时,完成3万多张独立插画,再进行手动微调。虽然目前还只是在原脚本和视频的基础上,通过AI逐帧完成图片生成的,但看到了AIGC参与到视频创作中的可能。而在诸多垂直类应用中,如体育、财经等,已经可以通过文字直接生成相应的短视频,如果配上虚拟人则可以实现自动播报。相比于单一的虚拟人读稿,基于AIGC生产的内容在镜头转换、表情动作结合方面更加逼真。 图表4:《幻觉东京》AI重制版 资料来源:公开资料,国盛证券研究所 随着NLP(NaturalLanguageProcessing,自然语言处理)技术和扩散模型(DiffusionModel)的发展,AI创造生成内容成为了可能。此前,内容生成主要运用GAN(GenerativeAdversarialNetwork,生成对抗网络)来实现的,GAN不同于扩散模型依赖于超大规模语言模型,因此难以实现通过文字的描述,自主理解内容并创造出图像、视频等。近年来,随着扩散模型的成熟,生成方式更接近于人脑的联想,AIGC完成了内容创造辅助工具到内容创作主体的角色转变。 2.AIGC是什么? AIGC是通过人工智能技术自动生成内容的生产方式。从Web1.0的单向信息传递的“只读”模式到Web2.0的人与人通过网络双向沟通交流的“交互”模式,内容的需求在不断增加。为了满足这一需求,同时也因为互联网的发展,内容的生成从单一的PGC演变到了现在的UGC并占据了主要市场。Youtube、Instagram、抖音、快手、B站上有大量的内容来自于UGC创作者。当我们迈入Web3.0时代,人工智能、关联数据和语义网络构建,形成人与机器网络的全面链接,内容消费需求飞速增长,UGC\PGC这样的内容生成方式将难以匹配扩张的需求。 图表5:内容生成的四阶段 资料来源:A16Z,国盛证券研究所 我们认为,AIGC将是Web3时代全新的内容生成工具,同样,将对现有的短视频、游戏及广告行业带来巨大的影响。AIGC的生成利用人工智能学习知识图谱、自动生成,在内容的创作为人类提供协助或是完全由AI产生内容。不仅能帮助提高内容生成的效率,还能提高内容的多样性。 2.1AIGC发展简史 AIGC的发展可以大致分为以下三个阶段: 早期萌芽阶段:20世纪50年代—90年代中期,受限于科技水平,AIGC仅限于小范围实验 沉积积累阶段:20世纪90年代中期—21世纪10年代中期,AIGC从实验向实用转变,受限于算法,无法直接进行内容生成 快速发展阶段:21世纪10年代中期—现在,深度学习算法不断迭代,AI生成内容种类多样丰富且效果逼真 图表6:AIGC发展历程 近年来,AIGC的发展迅速,从原来作为边缘侧服务于企业、机构的角色变为了现在C端零基础用户都可以使用的创作工具。开发侧重点上,AIGC也从原先用于翻译、语音合成以及重复性工作转变为了更注重应用层面,用户能够便捷操作的方向。 早期萌芽阶段 •1950年,图灵提出著名的“图灵测试”,给出判断机器是否具有”智能“的实验方法 •1957年,第一支由计算机创作的弦乐四重奏《依利亚克组曲》完成 •1966年,世界第一款可人机对话的机器人Eliza问世 •80年代中期,IBM创造语音控制打字机 沉积积累阶段 •2007年,世界第一部完全由人工智能创作的小说《1theroad》问世 •2012年,微软展示全自动同传系统 快速发展阶段 •2014年,IanJ.Goodfellow提出生成对抗网络GAN •2017年,微软“小冰”