AIGC行业投资机会梳理 --安信国际TMT 安信国际研究部 2023年5月15日 汪阳TMT行业分析员 alexwang@eif.com.hk 请参阅本报告尾部免责声明 目录 一 AI技术背景介绍 2 二 AIGC技术发展 5 三 AIGC产业应用 12 四 相关上市公司 18 AI算法不断迭代是AIGC进步的源动力 早期AI:依照实现制定的模板规则进行简单内容制作输出(学习能力低); 2006年:深度学习算法突破+硬件与互联网海量数据满足训练条件,发展正式 进入轨道(决策性AI); 2014年:生成式对抗网络(GenerativeAdversarialNetwork,GAN)为代表的深学习算法提出和迭代更新,AI正式迎来发展新时代。 决策式AI与生成式AI对比 AI模型可大致分为决策式/分析式AI(Discriminant/AnalyticalAI)和生成式AI(GenerativeAI) 两类。 决策式AI:学习数据中的条件概率分布,根据已有数据进行分析、判断、预测,主要应用模型有用于推荐系统和风控系统的辅助决策、用于自动驾驶和机器人的决策智能体。 生成式AI:学习数据中的联合概率分布,并非简单分析已有数据而是学习归纳已有数据后进行演绎创造,基于历史进行模仿式、缝合式创作,生成了全新的内容,也能解决判别问题。 类型 决策式AI 生成式AI 技术路径 已知数据分别求解输出类别标签,区分不同类型数据,例如将图像区分为猫和狗 分析归纳已有数据后创作新的内容,例如生成逼真的猫或狗的图像 成熟程度 技术成熟,应用广泛,辅助提高非创造性工作效率 2014年开始快速发展,近期发展速度呈指数级爆发,部分领域应用落地 应用方向 推荐系统、风控系统、决策智能体等 内容创作、科研、人机交互以及多个工业领域 应用产品 人脸识别、精准广告推送、金融用户评级、智能辅助驾驶等 文案写作、文字转图片、视频智能配音、智能海报生成、视频智能特效、代码生成、语音人机交互、智能医疗诊断等 资料来源:LearnOpenCV,海外独角兽 目录 一 AI技术背景介绍 2 二 AIGC技术发展 5 三 AIGC产业应用 12 四 相关上市公司 18 2022年AIGC火爆出圈 2022年AIGC火爆出圈:被消费者、投资界和技术产业界同时追逐; 事件一:8月科罗拉多博览会,AI绘画打败人类艺术作品; 事件二:“ChatGPT好得吓人,我们离强大到危险的人工智能不远了。” 事件三:美国数字媒体公司BuzzFeed与OpenAI合作,部分取代人类撰写文稿; 事件四:谷歌应对ChatGPT拉响“红色警报”+微软第三次入股OpenAI; 事件五:ChatGPT推出两个月MAU达到1亿,超越TikTok9个月和Ins2.5年(路透社)。 ChatGPT能写诗,能编程,能写论文《太空歌剧院》打败人类作品获得数字绘画一等奖 图片来源:GoogleImage 图片来源:GoogleImage ChatGPT横空出世 在AIGC图像生成火爆的同时,OpenAI旗下的ChatGPT横空出世,能理解各式各样的需求,做出回答、短文、诗歌、代码创作和逻辑计算等。 ChatGPT采用Web浏览器上的对话形式交互,不仅能够满足与人类进行对话的基本功能,能够回答后续问题、承认错误、质疑不正确的前提和拒绝不适当的请求。 ChatGPT还可以驾驭各种风格和文体,且代码编辑能力 、基础脑力工作处理能力等一系列常见文字输出任务的完成程度也大大超出预期。比如根据关键词或提问,生成剧本、发言稿等多种文书。因此,业内人士宣称ChatGPT已经大幅超越过去的A问答系统。 AI技术累计融合催生AIGC技术爆发 2014年GAN生成算法模型推出,为早起最著名的生成模型,并不断迭代不同衍生架构,广泛应用于生成图像、视频、语音和3D模型等。 2015年扩散模型(DiffusionModel)模型推出,现在主流的图形生成软件模型基础均为扩散模型,2021年OpenAI发表论文证明了这个结论; 2017年Transformer模型推出:基于自注意力机制的神经网络模型,最初用于文本翻译任务,可以用在自然语言处理(NLP)和计算机视觉(CV)领域 ,后来GPT-3等预训练模型(基于大量数据训练的具有巨量参数的模型,可以适应下有任务)都是基于Transformer模型建立; 2021年CLIP模型推出:进行自然语言理解和计算机 视觉分析,用标记好的“文字-图像”训练数据。 在多模态技术支持下,目前预训练模型多种多样,这些AIGC模型成为自动化内容生产的工具。 资料来源:腾讯研究院 国外主要AIGC预训练模型 8 资料来源:腾讯研究院 ChatGPT与前几代有什么不同 ChatGPT是基于GPT-3.5模型,训练集基于文本和代码,在微软AzureAI服务器上完成训练。 ChatGPT提升很明显的一个重要的原因是chatGPT引入了人类反馈的方式加强训练,通过人工标注训练数据,来训练回报模型,再采用强化学习来增强预训练模型的能力。2018年GPT的与训练数据量约5GB,2019年GPT-2运算量是40GB,2020年GPT-3达到45TB的海量数据。 背后公司OpenAI预计2023年和2024年收入将分别达到2亿和10亿美元;路透社称微软希望继续注资100亿美元,假如谈判达成,微软预计持股约49%。 资料来源:微信公众号科技投资猿 AIGC具备商业化优势 便捷性:大型语言和图像Al模型可用于自动生成内容,例如文章、博客或社交媒体帖子,对于定期创建内容的企业和专业人士来说,这是一种宝贵的节省时间的工具; 优质性:AlGC生成的内容可能比人类创建的内容质量更高,因为人工智能模型能够从大量数据中学 习并识别人类可能看不到的模式。这可以产生更准确和信息更丰富的内容; 多样性:AIGC模型可以生成多种类型的内容,包括文本、图像和音视频、3D内容等等。这可以帮助企业和专业人士创建更多样化、更有趣的内容,从而吸引更广泛的人群。 低成本:内容制作的成本显著降低、效率显著提高,不需要专业人士,以百倍以上的速度和效率,创造出有独特价值和独立视角的内容。 10 AIGC市场规模空间 目前AIGC在内容生成领域的渗透率不过低,根据Gartner的估算,2025年AIGC产生的数据将占10%;同时根据量子位智库的估算,预计到2030年,AIGC市场规模将超过万亿人民币规模。 资料来源:量子位智库 目录 一 AI技术背景介绍 2 二 AIGC技术发展 5 三 AIGC产业应用 12 四 相关上市公司 18 AIGC在内容创作领域的应用 AICG大幅度降低了数字内容生产的成本,打破了数字内容生产受到人类想象能力和知识水平的限制,广泛应用于文本生成、音频生成、图像生成、视频生成、跨模态生成及游戏领域,其广泛应用能够满足数字经济时代日益增长的数字内容供给需求。 类型 应用场景 文本生成 新闻播报等结构化写作剧情续写、营销文本等非结构化写作内容推荐、文章润色等辅助性写作智能客服、聊天机器人等交互式文本写作文本交互游戏等 音频生成 语音克隆由文本生成播报、虚拟人歌声等特定语音作曲、编曲、自动作词等乐曲/歌曲的生成 图像生成 去除水印、提高分辨率、滤镜等图像编辑工具按照特定属性生成画作、根据指定要求生成功能性图像 视频生成 删除特定主体、生成特效、跟踪剪辑等视频属性编辑视频换脸等视频部分剪辑对特定片段进行检测及合成等视频自动剪辑 跨模态生成 根据文字生成创意图像根据图片素材生成视频根据文字生成创意视频根据图像或视频生成文字 游戏 AIBotNPC逻辑及剧情 资料来源:AIGC/AI生成内容产业展望报告 AIGC商业化进行时 文本:最先进和最难理解的,随着时间推移和模型的改进应该可以看到更高质量的输出、更长的内容和更好的AI生成文本内容; 代码生成:短期对开发端带来重大影响,也能够降低开发门槛;GitHubCopilot现在在安装它的项目中生成了近40%的代码。但更大的机会可能是为消费者开放编码。学习Prompt(提示)可能会成为最终的高级编程语言; 图像生成:不同风格的美术可以快速建立素材库,降低购买版权成本,提供创意方向; 语音合成:目前已经存在一段时间(类似Siri),但消费者和企业场景越来越高端和复杂; 视频和3D游戏:素材构建成本大幅降低; etc... 1 4 资料来源:红衫资本《GenerativeAI:ACreativeNewWorld》 科技巨头积极布局 国内外科技巨头在生成式AI领域多有布局。国内公司百度、腾讯、阿里、华为、商汤等及国外公司谷歌、Meta、微软等均推出了生成式AI的应用产品,其中微软旗下OpenAI推出的GPT-4和ChatGPT最为出圈。 公司 典型产品 功能 国内公司 百度 文心 通过文字描述生成图片、图画修复、文档分析、生物分子结构分析等 腾讯 混元 覆盖了NLP、CV、多模态等基础大模型以及众多行业/领域大模型 阿里巴巴 通问千义 专业模型层深入电商、医疗、娱乐、设计、金融等行业。 华为 盘古 L0是类似于GPT3基础通用大模型,L1是基础模型与行业数据结合进行混合训练后的行业大模型 商汤 日日新 推自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力 国外公司 谷歌 PalM2、Bard 目前参数量最大的5400亿参数大模型PaLM的迭代版,基于100多种语言数据上训练而成PaLM2拥有更强大的逻辑推理能力,且部分能力超越了GPT-4 Meta LLaMa 包含70亿、130亿、330亿和650亿这4种参数规模的模型,旨在帮助研究人员和工程师探索人工智能应用和相关功能 微软 GPT-4、ChatGPT GPT-4大型多模态模型,能接受图像和文本输入,再输出正确的文本回复。实验表明,GPT-4在各种专业测试和学术基准上的表现与人类水平相当 资料来源:公司官网 国内AIGC产业链集中在中游 根据量子位智库的报告,我国的AIGC产业尚未发展成型,中外公司整体差差距3年左右,底层技术差距是核心; 我国的AIGC是巨头公司的边缘业务,用于辅助主业;独立运行的初创公司数量明显少于国外; 国外AIGC商业化变现逐渐成熟:API接口按量收费 ;产出内容收费(图片);软件对外出售(写作软件AXSemantics)等,但国内商业化场景大多处于针对C端客户吸引 AIGC引发的算力需求激增 整体而言,AI大模型时代的算力需求增长已经远超历史预期。据OpenAI测算,自2012年以来 ,全球头部AI模型训练算力需求3-4个月翻一番,每年头部训练模型所需算力增长幅度高达10倍。而摩尔定律认为,芯片计算性能大约每18-24个月翻一番,因此两者间的不匹配势必将带来对算力基础设施需求的快速增长。 目录 一 AI技术背景介绍 2 二 AIGC技术发展 8 三 AIGC产业应用 15 四 相关上市公司 18 算力核心标的:英伟达 硬件端:基于GPU、DPU和CPU构建英伟达加速计算平台生态: 主要产品TeslaGPU系列迭代速度快,从2008年至2022年,先后推出8种GPU架构,平均两年 多推出新架构,半年推出新产品。超快的迭代速度使英伟达的GPU性能走在AI芯片行业前沿 ,引领人工智能计算领域发生变革。 国内GPGPU生态起步较晚,国产GPU亟待补位。根据华为2021年9月发布的《智能世界2030》报告,人类将于2030年进入YB数据时代,通用算力相较2020年增长10倍、人工智能算力国产GPU厂商的核心架构多为自研,难度极高,需投入海量资金以及高昂的人力和时间成本。由于我国GPU行业起步较晚,缺乏相应生态,目前同国际一流厂商仍存在较大差距。在中美摩擦加剧、经济全球化逆行