人工智能系列报告 2024年1月24日 大模型专题报告:百模渐欲迷人眼,AI应用繁花开 行业评级:增持 中航证券社会服务团队分析师:裴伊凡 证券执业证书号:S0640516120002邮箱:peiyf@avicsec.com 中航证券研究所发布证券研究报告请务必阅读正文后的免责条款部分 核心观点 大模型演进:工业革命级的生产力工具。目前,ANI已经广泛应用,AGI处于研发阶段,大模型是实现AGI的重要路径。AI大模型通过预先在海量数据上进行大规模训练,而后能通过微调以适应一系列下游任务的通用人工智能模型。在“大数据+大算力+强算法”的加持下,进一步通过“提示+指令微调+人类反馈”方式,实现一个模型应用在很多不同领域。人工智能的发展已经从“大炼模型”逐步迈向了“炼大模型”的阶段,逐渐掀起多模态和多场景革命,重塑AI技术范式,提升模型能力天花板,应用价值显著提升。 大模型现状:GPT引领,百模征战。(1)ChatGPT加速迭代:从GPT-1至GPT3.5跨越4年多时间,ChatGPT发布仅一年,GPT迭代开启“加速度”,现已具备多模态能力,并搭建GPTs生态,将定制化模型从ToB推广到ToC,低门槛、低成本、定制化的特点,使得GPTs具备普及性和颠覆性。(2)他山之石:据业界不完全统计,23H1硅谷在人工智能领域共完成了42起融资,总金额约140亿美元(占世界总融资金额的55%),应用方面的投资金额仅次于大模型,垂类场景应用的融资中对话机器人占据绝对优势。(3)国内大模型:科技型企业包括人工智能企业、垂直大模型企业和数据智能服务商相继进场,如商汤科技、度小满和滴普科技等企业,以百度、腾讯和阿里为代表的互联网云厂商占据中国通用大模型行业多数市场份额,在布局时间、基础设施建设、应用场景等方面具备明显优势。(4)爆款应用:基于ChatGPT的火爆和大模型的迭代发展,海内外AI在对话、图像、教育、办公等多个领域出现爆款应用。 大模型未来:应用多点开花,产业智能跃迁。(1)内容变革:拥有通用性、基础性多模态、参数多、训练数据量大、生成内容高质稳定等特征的AI大模型成为了自动化内容生产的“工厂”和“流水线”,随着GPTstore的出现,AI大模型将迎来自己的“APPStore”时代,AIGC商业应用的前景愈发广阔。(2)模型演绎:多模态模型核心目标是模拟人类大脑处理信息的方式,以更全面、综合的方式理解和生成信息,底层通用大模型目前成为最受关注、建设和提升迫切性最强的领域,中间层模型国内目前尚未出现相关玩家。(3)AIGC主流的营收模式 可分为四种:MaaS、按产出内容量付费、软件订阅付费、模型定制开发费。目前,按照产出量收费的模式占据主流,但随着底层模型即AIGC生态的建立,最具长期增长潜力并将占据主要市场规模的为MaaS模式。据量子位预测,2023年AIGC不同商业模式规模约170亿元,预期2026将翻一番,2030年有望突破万亿市场规模。 投资建议:关注数据端&模型端&应用端。GPT产品的更迭标志着人工智能进入了新的发展阶段,模型技术、参数、训练数据、训练方法的演化融合方面取得了实质突破,AI大模型已成为优化算力瓶颈、放大数据优势、发展数字经济的重要拼图,掀起“数据-模型-应用”的飞轮效应。随着多模态大模型能力的跃迁、GPTs生态的建立以及对话、图像、办公、教育等领域AI标杆类应用的出现,AI已经具备从纯技术衍生的轻量工具产品向有具体落地场景的深度产品融合演变的能力,诸多行业将迎来工业级生产力变革,降本增效效能凸显,数字化程度高、内容需求丰富的行业商业化及业绩兑现逻辑已完备。重点关注:数据端(中文在线/视觉中国/中国科传/中信出版/果麦文化/中文传媒/南方传媒);模型端:布局GPTs生态的模型公司(昆仑万维/科大讯飞);应用端:游戏(三七互娱/恺英网络/世纪华通/汤姆猫/神州泰岳);电商(小商品城/华凯易佰/吉宏股份/值得买);办公(万兴科技/金山办公/泛微网络);教育(世纪天鸿/创业黑马/奥飞娱乐);影视传媒(捷成股份/上海电影/光线传媒/人民网/新华网);广告营销(蓝色光标/三人行/风语筑)。 风险提示:行业监管风险、政策收紧的风险、技术发展不及预期的风险、内容生态建设不及预期的风险、变现不及预期风险、舆论炒作风险、市场竞争风险。 资料来源:中航证券研究所整理2 1 大模型演进:工业革命级的生产力工具 3 2 CONTENTS 目大模型现状:GPT引领,百模征战 大模型未来:应用多点开花,产业智能跃迁 5 4 录投资建议:关注数据端&模型端&应用端风险提示 算法的迭代推动人工智能的发展:几十年来,AI领域持续探索,1940-1980s符号AI占主导,1980年后,统计AI与神经AI齐头并进,二者竞争发展至今,GPT系列属于神经AI。 符号(Symbolic)AI:二十世纪80年代以前属于符号AI时代,开启了以知识建模算法、专家系统算法为代表AI早期发展阶段; 统计(Statistical)AI:1985年的贝叶斯网络和1995年的SVM是20世纪机器学习发展的两大标志,但近年来,逐渐成为非主流的研究方向; 神经(Neural)AI:经历了1980s-2012年神经网络、2012年后的深度学习两大阶段,深度神经网络和模型大小呈正相关,伴随着模型参数量的增加,相对应深度神经网络的能力将大幅提升,GoogleBrain的Transformer和OpenAI的GPT系列都属于深度学习领域的代表作。 图表1:人工智能的发展历史 SymbolicAI •将人类专家的知识和经验转化为计算机可以理解的形式,并利用AI技术来实现 •手写规则,简单粗暴 •只能处理非常少量数据 •像人脑一样学习 •开始尝试大量数据 •提前标注数据 •应用于计算机视觉、自然语言 处理、语音识别等领域 1985至今1980s-20122017 GPT系列 •基于Transformer架构 •投喂海量学习数据 •无监督训练方法 •通用文本预训练 2018 1970-1980s •找到一些函数或参数 •分类固定量数据 •应用于数据分析、预测和分类等任务 机器学习 StatisticalAI •全注意力机制 •关注文本序列数据 整体注意力 Transformer 知识建模、专家系统 神经网络 NeuralAI 神经人工智能 深度学习 目前,ANI已经广泛应用,AGI处于研发阶段,大模型是实现AGI的重要路径。 ANI(专用人工智能,ArtificialNarrowIntelligence)又称为弱人工智能,是专注于执行某一领域任务的经过训练的人工智能,是目前大多数的AI形式; AGI(通用人工智能,ArtificialGeneralIntelligence)是指一种具有与人类相当的认知能力的智能系统,能够理解、学习、计划和解决问题,目前尚未真正实现; ASI(超级人工智能,ArtificialSuperIntelligence)指在几乎所有领域都超过最优秀的人类所具备的智能、知识、创造力、智慧和社交能力的智能系统。 图表2:人工智能的三种类型比较 擅长领域 具备能力 发展成熟度 专用人工智能(ANI) 某一特定领域 具备执行能力 已应用广泛 通用人工智能(AGI) 大部分领域 拥有能够与人类相媲美的智慧 处于研发阶段 超级人工智能(ASI) 所有领域 全知全能 尚处早期 人工智能大模型:人工智能大模型是在参数和架构的基础上构建起来的一种结构,是人工智能迈向通用智能的里程碑技术,通过预先在海量数据上进行大规模训练,而后能通过微调以适应一系列下游任务的通用人工智能模型。在“大数据+大算力+强算法”的加持下,进一步通过“提示+指令微调+人类反馈”方式,可以实现一个模型应用在很多不同领域。 大模型VS小模型:人工智能的发展已经从“大炼模型”逐步迈向了“炼大模型”的阶段。“小模型”,针对特定应用场景需求进行训练,能完成特定任务,但是换到另外一个应用场景中可能并不适用,需要重新训练,如果某些应用场景的数据量少,训练出的模型精度就会不理想;“大模型”,在大规模无标注数据上进行训练,学习出一种特征和规则,基于大模型进行应用开发时,将大模型进行微调(在下游小规模有标注数据进行二次训练)或者不进行微调,就可以完成多个应用场景的任务,实现通用的智能能力。 图表3:大模型的特性图表4:大模型技术原理 通用性 大模型可以快速并大规模地与云计算、互联网等其他技术结合,广泛地应用在经济的各个领域。 涌现性 大模型参数超过百亿级时,模型性能会呈现出指数级增长,同时能够对未经专门训练的问题举一反三。 高投入 大模型具有重投入、长周期的特点,如每次测试需要海量的算力资源,训练一次成本高达千万美元。 工程化 大模型对数据、算法、算力要求极高,需要工程化的经营思路,需要严格把控数据清洗,把控用于关键性训练的数据,和构建大规模高质量训练的算力。 按照功能可分为NLP大模型、CV大模型、科学计算大模型和多模态大模型。 NLP(NaturalLanguageProcessing,自然语言处理)大模型:LLM为NLP大模型的一种,主要用于处理自然语言文本数据,具备强大的语言理解和生成能力,帮助人奏完成问答、创作、文本等工作,例如OpcnAl的GPT系列模型; CV(ComputerVision,计算机视觉)大模型:主要用于处理图像和视频数据,具备强大的围像识别和视频分析能力,如人脸识别、物体检测等,具体可以在智能驾驶、安防等领圾进行利用,例如腾讯的PCAM大模型; 科学计算大模型:主要用于解决科学领圾的计算问题,如生物信息学、材科科学、气侯模拟等,需要处理大规模教值数据,例和华为的盘古气象模型; 多模态大模型:可以同时处理多种类型的模态数据,如文本、围像、语音等,实现跨模态搜索、跨模态生成等任务,已有的渗透应用具休包括搜索引学、办公工具、全融电商等,例如谷歌的VisionTransformer模型。 图表5:AI大模型基本分类 大模型类别 基本功能 下游应用 应用占比 应用表现分析 NLP自然与处理大模型 文本分类情感分析问答系统 金融、泛消费、办公等交互类场景 在交互类场景中发挥重要作用,商业化应用程度高 所处阶段:快速发展期 CV计算机视觉大模型 物体检测人脸识别图像分类 安防、工业、交通、物流、医疗等领域 已助力安防、物流等领域提升视觉泛化,国内众多企业正深耕于研发和内部测试 所处阶段: 发展初期 科学计算大模型 气候模拟生物信息学数值模拟 生物制药、气象预报、材料研发等领域 用于解决复杂科学问题,但需要专门高性能计算机的支持 所处阶段: 雏形阶段 多模态大模型 跨模态检索多模态生成多媒体理解 泛娱乐、传媒、电商等领域 应用潜力较大,但当前仍有关键性问题尚待解决 所处阶段: 雏形阶段 AI大模型掀起多模态和多场景革命,重塑AI技术范式,提升模型能力天花板,应用价值显著提升。多模态融合模型通过充分利用大模型的泛化能力、构建多模态数据集、解决融合和对齐问题,以及提供强大的计算资源支持,可以将不同类型的数据(如图像、视频、声音等)通过预处理转化为统一的表示形式,结合多个模态的信息进行联合建模和分析,从而提升其在多个感知任务上的性能和表现。 图表6:AI大模型的应用场景(按模态区分) 1 大模型演进:工业革命级的生产力工具 3 2 CONTENTS 目大模型现状:GPT引领,百模征战 大模型未来:应用多点开花,产业智能跃迁 5 4 录投资建议:关注数据端&模型端&应用端风险提示 从GPT-1至GPT3.5跨越4年多时间,ChatGPT发布仅一年,GPT迭代开启“加速度”,现已具备多模态能力,并搭建GPTs生态,将定制化模型从ToB推广到ToC。 图表7:GPT产品迭代图 2017-2022年模型内部迭代期:Transformer→GPT-1/2/3→