您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[长城证券]:AIGC策略深度报告:人工智能登高一呼,模型生态群山四应 - 发现报告
当前位置:首页/宏观策略/报告详情/

AIGC策略深度报告:人工智能登高一呼,模型生态群山四应

2023-04-16长城证券巡***
AI智能总结
查看更多
AIGC策略深度报告:人工智能登高一呼,模型生态群山四应

AIGC产业技术加速发展,产业链呈现为三层架构。诸多AI技术累计融合,催生了AIGC的技术变革,使AI工程化门槛不断降低。AI发展周期可以划分为2012年-2018年与2017年至今两个阶段,未来文本、图片、语音等场景将逐步走向成熟,将助推技术向多模态融合发展。AIGC产业链可分为上游基础层、中间技术层、下游应用层三个层级。人工智能赋能产业发展已成为主流趋势,AI将参与到社会建设的千行百业中来,应用场景进一步多元化。 人工智能持续升温,产业进入高速发展阶段。在政策和市场的共同驱动下,中国乃至全球人工智能市场规模持续扩大。当前人工智能算力持续突破,GPU领域或因算力需求增长受益。人工智能在我国呈现为政策大力支持、商业化应用逐步落地、产业技术加速创新升级的发展趋势,行业发展潜力巨大。 依据当下AIGC产业链分布,算力及中间层企业发展机会较大。 许多科技巨头已布局多年,应用“模型+工具平台+生态”三级协同加速产业智能化。海外玩家中谷歌推出了NLP大模型Bert,微软推出的是chatGPT,二者分别在语言理解类和语言生成类任务上有着更好的表现。国内厂商则主要包括百度、阿里、360、华为等人工智能企业,也有智源研究院、中科院自动化所等研究机构。 风险提示:宏观经济下行;科技转化不及预期;AI商业化进程不及预期;行业竞争加剧的风险。 一、行业梳理 (一)AIGC的概念与内涵 2022年是AIGC爆火出圈的一年,随着AI作画风行一时,chatGPT刷爆网络,不仅消费者竞相追捧AIGC,投资界也积极关注,还被全球各大科技企业竞相追逐。据中国信通院AIGC白皮书定义,AIGC(Al-Generated Content)即人工智能生产内容,可用于代码生成、文本问答、图像生成等,既是从内容生产者视角进行分类的一类内容,又是一种内容生产方式,还是用于内容自动化生成的一类技术集合。 AIGC技术能力根据面向对象、实现功能的不同可分为三个层次:智能数字内容孪生(可分为智能增强技术和智能转译技术)、智能数字内容编辑、智能数字内容创作。根据Gartner测算,当前生成式人工智能占所有数据产量不到1%,其生成数据渗透率有广阔提升空间,预计至2025年将上升至10%。 (二)AIGC的发展流程 据甲子光年智库分析,人工智能主要包括六大学科,当下业界讨论往往聚焦机器学习这一学科,其在各种领域都具有广泛的应用前景,包括自然语言处理、计算机视觉、电子商务等等。人工智能算法的不断迭代是AIGC发展进步的源动力,诸多AI技术累计融合,尤其是深度学习模型方面的技术创新,催生了AIGC的技术变革,使AI工程化门槛不断降低,有望重新定义生产力。 基础的生成算法模型不断突破创新,Transformer、扩散模型等深度学习的生成算法相继涌现;预训练模型(PLM)引发了AIGC技术能力的质变,2018年以来,预训练语言模型及其”预训练-微调”方法已成为自然语言处理(NLP)任务的主流范式,规模越大的模型不仅在已知任务上有着更好的表现,同时展现出完成更复杂的未知任务的强大泛化能力; 多模态技术推动了AIGC的内容多样性,让其具有了更通用的能力。 图表1:2022年Gartner人工智能技术成熟度曲线 据创新工场定义,AI发展周期可以划分为以下两个阶段: AI的1.0时代(2012年-2018年):主导逻辑是大数据、小算力、专用决策范式。存在单领域、多模型的限制,数据集、模型碎片化明显、AI泛化能力不足,大多数行业需要花费巨大成本来收集和标注数据以利用AI,从而导致规模不经济。AI 1.0缺乏规模化能力来降低应用开发的门槛,打造完善生态链,因此商业化价值较小。 AI的2.0时代(2017年至今):预训练大模型在无需人工标注的海量数据的学习训练后具有良好的通用性和泛化性,通过微调等方式适配和执行五花八门的任务,能显著降低AI工程化门槛,让其成为自动化内容生产的“工厂”和“流水线”。GPT-3的出现让大数据、大算力和通用范式成为典型模式,AIGC模型有望逐步达到具有预测、决策、探索等更高的认知智能,真正有望实现平台化的效应,进而探索商业化的应用创新机会。 图表2:人工智能1.0时代与2.0时代 未来文本、图片、语音、代码等场景将逐步走向成熟,将助推技术向多模态融合发展,五大方向路径分别为:文本到文本AIGC,如大型语言模型聊天机器人ChatGPT;文本到图像AIGC,如谷歌推出的文本到图像的扩散模型Imagen;文本到3DAIGC,如谷歌推出的DreamFusion可以根据给定的文本创建3D模型;音频相关AIGC,如Murf AI推出的人类语音生成器;图像到图像AIGC,如Preferred Networks推出的Crypko可以创作上半身动漫形象。 图表3:生成式AI技术的成熟应用进程时间表 (三)AIGC的产业分布 AI的七大关键能力为感知、认知、决策、学习、执行、社会协作能力以及符合人类情感、伦理与道德观念,这些能力在进化中逐步扩展累积,逐步“解放大脑”。AIGC的本质是内容与场景的融合,其发展需要AI模型、基础设施、上层应用的相互配合,后端基建,算法、算据和算力三要素耦合共振。 图表4:AI发展三要素 AI全栈技术架构分为三个层级:算力层、平台层和算法层,其中,算法层包括应用层、中间层和基础层或模型层中间层可向下对接大模型能力,向上提供个性化服务,由一批专门负责调整大型模型以适应具体应用需求的初创企业构成。而基础大模型将逐步走向统一,形成寡头格局,开发人员将基于这些基础模型研发AI应用。 图表5:AIGC算法层技术架构拆解 目前,AIGC产业生态加速形成和发展,产业链呈现为上中下三层架构,包括上游基础层、中间技术层、下游应用层三个层级。基础层由于预训练模型的高成本和技术投入,因此具有较高的进入门槛,主要参与机构为头部科技企业、科研机构等;中间技术层使模型即服务(MaaS)开始成为现实,预计将对商业领域产生巨大影响;应用层旨在无缝衔接AICG模型和用户需求,以实现产业落地。 图表6:人工智能产业链 二、商业模式 (一)ChatGPT引入Plugins,大幅拓展应用能力 OpenAI于3月24日发布ChatGPT,即ChatGPT插件集,插件是专门为以安全为核心原则的语言模型设计的工具,可以帮助ChatGPT访问最新信息、运行计算或使用第三方服务。从OpenAI的等待列表中被邀请的插件开发人员可以为ChatGPT构建一个插件,如由Expedia、FiscalNote和Instacart等创建的第三方插件,普通用户可以选择自己需要的插件使用。 图表7:OpenAI第三方插件 OpenAI专门为chatGPT开发了两大插件:网络浏览器(Browsing)和代码解析器(Code interpreter)。Plugins引入后,ChatGPT的应用能力将得到极大的扩展,进一步催化至多场景的业务处理能力。开发者想从一小部分用户开始,基于此了解更多信息,逐步推出更大规模的访问,以塑造人机交互范式未来的社区。Browsing实现了ChatGPT的联网能力,可以读取互联网上的最新信息;Code interpreter则实现了用Python代码去解决定性或定量的数学问题,进行数据分析,以及格式转换等。当前,插件还在alpha期间,OpenAI将与用户和开发人员密切合作,对插件系统进行迭代。 插件可以成为语言模型的“眼睛和耳朵”,使它们能够访问非常近期、非常个人或者非常具体而不能包含在训练数据中的信息。在响应用户的明确请求时,插件还可以使语言模型代表用户执行安全的、有约束的操作,从而提高系统的整体有用性。引入插件后的chatGPT影响力将显著提升,生态规模极速扩大,应用层百花齐放。插件的价值可能远远超出现有的限制,从浏览产品目录到预订航班或订购食品,帮助用户使用各种新的用例。OpenAI认为,插件可能会产生广泛的社会影响,他们发现使用工具的语言模型可能会比没有工具的语言模型产生更大的经济影响,并预计当前的人工智能技术浪潮将对工作转换、取代和创造的速度产生重大影响。 (二)开启API收费服务,与微软深度合作,OpenAI商业化进一步推进 2023年3月1日,OpenAI宣布以收费形式开放ChatGPT API和Whisper API(应用程序接口),允许外部公司开发者将ChatGPT集成至他们的应用程序和服务中。宣布之时共有5家公司接入ChatGPT API,分别是Snapchat母公司Snap lnc、全球学习平台Quizlet、日用百货配送公司Instacart、消费者购物软件shop的开发商Shopify以及教育软件Speak的开发商。 OpenAI根据API调用的token(分词)输入和输出总数计费,同时token总数还需低于模型最大限制。新发布的ChatGPT模型其API收费标准为0.002美元/1000tokens,与前一代使用模型相同,但比现有的GPT-3.5模型价格便宜了90%。Whisper API是一种语音转换文字(speech to text)模型,可以转写或翻译语音,支持包括英语、中文、阿拉伯语和日语等几十种语言,现在通过该API提供了large-v2模型,Whisper API的使用费用为每分钟0.006美元。 在订阅渠道,2023年2月1日,OpenAl宣布,推出其人工智能聊天机器人ChatGPT的付费订阅版本ChatGPTplus,每月收费20美元,订阅用户即使在高峰时段ChatGPT也可以正常访问,有更快的响应时间,还可以优先访问新功能。同时OpenAl也继续提供ChatGPT的免费访问。 OpenAI已同意将GPT-3授权给微软用于他们自己的产品和服务。微软作为OpenAI最为重要的合作伙伴和投资人,其旗下产品与OpenAI的相关模型深度融合,在微软的消费者和企业产品中引入新的体验。如搜索引擎结合GPT4的技术,企业服务平台Dynamic 365结合ChatGPT的技术推出Dynamics 365 Copilot,开发者工具Power Platform结合ChatGPT技术推出Power Virtual Agents和AI Builder。微软产品在融合了OpenAI技术后展现出了更优秀的产品性能和市场竞争力,而OpenAI将利用微软Azure云计算服务提供的算力,以更快地实现AI的突破。微软投资OpenAl扩展合作伙伴关系,一方面为了加强AZure竞争力来对抗云计算领域的巨头亚马逊,另一方面,微软正式推出由ChatGPT支持的最新版本Bing(必应)搜索引擎和Edge浏览器,直接挑战了谷歌的搜索引擎巨头地位。 三、应用场景 基于软件服务、云服务、硬件基础设施等产品形式,结合消费、制造业、互联网、金融、元宇宙与数字孪生等各类应用场景,人工智能赋能产业发展已成为主流趋势。根据艾瑞咨询统计,2022年,人工智能产学研界在通用大模型、行业大模型等促进技术通用性和效率化生产的方向上取得了一定突破。商业价值塑造、通用性提升和效率化应用是AI产业发展战略方向,人工智能将参与到社会建设的千行百业中来。 目前,AIGC已经在多个领域得到广泛应用,如金融、传媒、文娱、电商等,未来应用场景会进一步多元化,如数据科学、医疗、游戏、艺术等。除应用场景的横向扩展外,场景与场景的融合交互也是未来的发展趋势之一,例如“文旅+游戏”、“商业+艺术”等。 图表8:AIGC的应用领域 根据红杉资本对市场格局的分类,AIGC按不同细分方向应用可分为: 文本领域。是发展最完备的领域,目前在通用的中、短篇写作方面表现还算不错,但通常只被用来生成初稿或对初稿做迭代完善。随时间推移,有望看到更高质量及更长篇的内容,并且针对各垂直领域有特定的优化。 代码生成。如GitHub CoPilot,它能极大提高程序开发者的生产力,也能助力非专业人员编写代码。 图像领域。其应用爆发是新近之事,因为相较文字图像是社交媒体上更受欢