计算机 行业研究/深度报告 ChatGPT引发的大模型时代变革 报告日期:2023-02-25 行业评级:增持 主要观点: ChatGPT带来大模型时代变革,数据要素重要性提升 ChatGPT是由OpenAI研发的一种语言AI模型,其特点在于使用海量 行业指数与沪深300走势比较 分析师:尹沿技 执业证书号:S0010520020001电话:021-60958389 邮箱:yinyj@hazq.com 分析师:�奇珏 执业证书号:S0010522060002邮箱:wangqj@hazq.com 分析师:胡杨 执业证书号:S0010521090001邮箱:huy@hazq.com 分析师:张天 执业证书号:S0010520110002邮箱:zhangtian@hazq.com分析师:金荣 执业证书号:S0010521080002邮箱:jjinrong@hazq.com 相关报告 1.华安证券_公司研究_计算机行业_行业深度_华安证券2023年计算机推演:数字经济+_2022-12-12 2.华安证券_公司研究_计算机行业_行业深度_华安证券数字经济系列报告(一):科技赋能、新基建,数字经济大有可为_2022-03-09 语料库来生成与人类相似的反应。初代GPT模型参数1.17亿,GPT2模型、GPT3模型参数分别达到15亿、1750亿。不断提升的参数量 级,使得ChatGPT3当前已经能够应用在商业、研究和开发活动中。 当前此类参数体量庞大的模型,成为各大科技厂商研发重点。大模型的基础为高质量大数据。ChatGPT的前身GPT-3就使用了3,000亿单词、超过40T的数据。此类大数据基础的前提为三部分1)有效场景下 的采集数据;2)大数据的存储、清洗和标注;3)数据质量检验。 大模型发展之下,算力与网络设施建设成为刚需 算力:ChatGPT类人工智能需要更充足的算力支持其处理数据,带来更 多高性能的算力芯片需求。英伟达表示,GPT-3需要512颗V100显卡训练7个月,或者1024颗A100芯片训练一个月。2012年以来,AI训练任务中的算力增长(所需算力每3.5月翻一倍)已经超越摩尔定律(晶 体管数量每18月翻一倍)。 网络设施:以微软Azure为例,其AI基础设施由互联的英伟达AmpereA100TensorCoreGPU组成,并由QuantuminfiniBand交换机提供横向扩展能力。服务器节点多、跨服务器通信需求巨大,网络带宽性能成为 GPU集群系统的瓶颈,解决方式包括增加单节点通信带宽与降低网络收 敛比,带来光模块、交换机等需求。 下游应用场景丰富,多行业落地可期 1)“生成式AI(generativeAI)”在互联网及元宇宙领域市场化空间较为广阔。基于现行的NLP算法发展程度及数据集规模。在不久的将来,生成式AI有较大可能在“智能客服”和“搜索引擎”进行增值,并有希望以“插件”的形式赋能现有的“生产力工具链(工程软件/音视频制作工具等)”。 2)AI在制造业的应用可分为三方面:a)智能装备:指具有感知、分析、 推理、决策、控制功能的制造装备,典型代表有工业机器人、协作机器人、数控机床等;b)智能工厂:重点在于实现工厂的办公、管理及生产自动化,典型的代表场景有协作机器人、智能仓储物流系统等;c)智能服务:指个性化定制、远程运维及预测性维护等。 3)人工智能在智能汽车领域的应用包括:a)智能驾驶依托AI,将从驾驶辅助发展至自动驾驶;b)智能座舱在AI支持下,从出行工具演变为出行管家。 风险提示 国内大模型不及预期风险;行业竞争加剧风险;AI应用的伦理道德风险;芯片及技术供应风险;商业模式变现与落地不及预期风险。 正文目录 1引言7 2CHATGPT引发人工智能投资热潮8 2.1CHATGPT是什么?8 2.2CHATGPT技术和传统的AI有什么区别?9 2.3CHATGPT将给行业带来哪些机会?11 1)语音识别与自然语言处理行业快速发展:11 2)激活产业链:12 3数据要素资源基础,满足大模型训练需求13 3.1政策引导数据要素确权使用,扫清人工智能发展障碍13 3.2大数据管理能力需求提升14 3.3数据标注,是AI模型的基础16 3.4相关标的18 1)星环科技:平台、数据库集一身的数据要素稀缺标的18 2)海天瑞声:人工智能基础数据服务提供商,产品矩阵不断丰富21 4CHATGPT带来的变革——大模型算法23 4.1大模型时代的引言:DOUBLEDESCENT(双下降)现象23 4.2首要关键技术:TRANSFORMER模型24 4.3GPT快速迭代,从GPT1.0迅速步入3.5时代24 4.4国内外AI大模型项目百舸争流26 4.5相关标的30 1)商汤科技30 2)科大讯飞32 3)云从科技33 4)依图科技34 5)旷视科技35 5算力与网络是大模型运行的必要条件37 5.1大模型发展,算力需求激增37 5.2GPU/GPGPU/FPGA多路线支持算力37 5.3高带宽网络是对人工智能算力的重要支撑39 5.4量子计算有望成为AI算力突破的“神助攻”45 5.5相关标的48 1)海光信息:国产CPU与GPGPU重要参与者48 2)复旦微电:FPGA受益算力增长49 3)中际旭创:全球光模块龙头迎来800G时代51 4)联特科技:欧美中低速WDM主流供应商,数通光模块“黑马”52 5)天孚通信:光通信精益制造代表,光引擎、激光雷达成长速度快52 6)国盾量子:量子计算机已实现原型机搭建52 7)浪潮信息:国内领先AI服务器厂商52 6从元宇宙到大制造,大模型应用领域不断丰富54 6.1“生成式AI”在互联网及元宇宙应用54 1)“生成式AI”在智能客服领域的潜在应用54 2)“生成式AI”在搜索引擎领域的潜在应用56 6.2AI赋能制造业转型升级,智能制造浪潮兴起63 1)智能装备产业百花齐放,工业机器人与高端数控机床空间广阔63 2)智能工厂是实现智能制造的载体,协作机器人与智能仓储物流是工厂新星69 6.3AI赋能工业互联网,打造高效率设备管理和生产流程72 6.4人工智能助力汽车智能化75 1)智能驾驶:从驾驶辅助到自动驾驶75 2)智能座舱:从出行工具到出行管家77 风险提示:79 图表目录 图表1CHATGPT开启收费模式8 图表2CHATGPT操作界面9 图表3CHATGPT模型流程图10 图表4TRANSFORMER模型工作流程11 图表5中国按类别划分的人工智能软件市场12 图表6数据已成为�大核心生产要素之一13 图表72015-2021年GDP增速与数字经济增速14 图表82015-2020年数字经济占GDP的比重14 图表9《规划》提出“1+7”的指标体系14 图表102017与2022年人均联网设备数量15 图表112017-2022全球网络流量15 图表12全球大数据市场规模15 图表13全球大数据软件市场规模15 图表14我国大数据市场规模16 图表15我国大数据软件市场规模16 图表16人工智能基础数据服务流程与主要产品16 图表17训练数据需求量(条)17 图表18受访者遇到的与数据相关的难题及比例(%)17 图表192017至2029年中国数据标注行业市场规模17 图表202021年我国数据标注行业下游需求占比(%)17 图表21面向AI的数据治理产业图谱18 图表22星环科技发展历程示意图19 图表23星环科技股权结构20 图表24星环科技产品格局20 图表25海天瑞声产品服务矩阵21 图表26海天瑞声训练数据集服务的算法模型应用场景示意22 图表27BIS-VARIANCE图内的双下降曲线23 图表28TRANSFORMER模型自监督层结构24 图表29TRANSFORMER模型架构24 图表30OPENAIGPT发展历程24 图表31不同模型参数量与模型精度的关系25 图表32GPT-3到GPT-3.5的演进过程26 图表33大模型发展迭代图27 图表34百度文心生态图28 图表35ERNIE3.0模型架构28 图表36MINDSPORE自动并行框架29 图表37大模型训练需求对比30 图表38SENSECORE商汤AI大装置中心30 图表39商汤科技主要产品结构32 图表40科大讯飞业务全景示意图33 图表41云从科技主要产品及服务图谱34 图表42依图科技主要解决方案35 图表43旷视科技AIOT软硬一体化解决方案36 图表44算力需求变化37 图表45深度学习中训练和推理的演示38 图表46全球GPU行业市场规模38 图表47中国GPU行业市场规模38 图表48全球FPGA芯片市场规模39 图表49中国FPGA芯片市场规模39 图表50AI加速服务器全球出货量渗透率迅速提升(单位:百万)40 图表51英伟达DGXA100SU(包括20台DGXA100服务器)是SUPERPOD集群基本组成单位40 图表52腾讯星脉AI集群组网架构41 图表53AI集群高性能方案关键技术组合41 图表54英伟达DGXA100服务器使用了200G高速光连接42 图表55DGXH100使用了400GCONNECTX-7网卡42 图表56英伟达QUANTUM-2INFINIBAND交换机提供64*400GBPS交换容量42 图表57微软数据中心网络2024年部署将全部为400G43 图表58微软400G数据中心网络架构43 图表59数据中心200G以上高速光模块出货量高速增长44 图表60交换机芯片通过SERDES直驱光模块实现高频电信号走线缩短45 图表61全球量子计算市场或在2025年达到12亿美金45 图表62量子计算未来三年主要市场结构46 图表63量子计算未来三年主要应用的算法领域46 图表64学术界目前探讨的量子计算可能展现出优势的人工智能算法46 图表65变分量子算法示意图47 图表66剑桥量子计算公司(CQC)首次在量子计算机执行自然语言处理测试获得成功48 图表67海光DCU基本架构49 图表68海光8100系列产品主要规格和特点49 图表69复旦微电产品主要规格和特点50 图表70FPGA结构特点51 图表71全球“对话AI(CONVERSATIONALAI)”市场空间55 图表72“智能对话机器人”在各领域全球市场空间(亿USD)55 图表73全球“智能对话机器人”智能客服领域市场空间(亿USD)56 图表74智能对话机器人-电商客服领域全球市场空间测算(亿USD)56 图表75谷歌服务(GOOGLESERVICES)收入(亿USD)57 图表76GPT3各类模型的训练的参数量58 图表77GPT模型训练成本58 图表78“生成式AI”对搜索引擎的影响59 图表79生成式AI与搜索引擎结合面临的挑战59 图表80“生成式AI”的应用–新BING(NEWBING)搜索案例展示60 图表81“生成式AI”的应用–新BING(NEWBING)可对话的领域举例60 图表82“生成式AI”的应用–谷歌巴德61 图表83百度文心全景图、历程和架构62 图表84人工智能在制造业的应用63 图表85工业机器人应用汇总64 图表862015-2022年中国工业机器人产量64 图表872015-2022年中国工业机器人销量64 图表882017-2024年全球工业机器人市场规模(销售额口径)65 图表892017-2024年中国工业机器人市场规模(销售额口径)65 图表90高端数控机床的基础构成66 图表91高端数控机床的下游应用66 图表92中国数控机床下游应用领域占比67 图表932017-2022年中国数控机床市场规模统计预测67 图表94我国支持高端数控机床发展的文件/政策68 图表95中国机床消费结构69 图表96机床更新需求测算69 图表97协作机器人特点70 图表982021年中国协作机器人应用行业分布70 图表992016-2021年中国协作机器人市场规模70 图表100仓储物流自动化系统构成71 图表1