算力层激励频出,奠定AI大时代基础。5月以来,国内算力层激励政策频 出,包括,5月16日北京出台《北京市促进通用人工智能创新发展的若干 措施(2023-2025年)(征求意见稿)》,从算力、算法、模型、应用、监 管等五大方面引领AI发展;5月18日,中国电子董事长曾毅发言,算力底 座是下一阶段最需要解决的问题;5月19日,北京市通用人工智能产业创 新伙伴计划成员名单(第一批)出路。AI大时代正拉开序幕,而算力是必 需的基础设施。 AIGC有望大幅提振算力需求,多模态已渐行渐近。1)AIGC大模型的算力 需求,来自于其千亿级别的参数量、以及通用广泛的应用场景。2)根据我 们估算,以使用英伟达A100芯片等作为基础假设,推理阶段算力初始投入 约近8亿美元;另外,考虑Google每日搜索量已达到35亿,我们认为Chatgpt 日活提升空间广阔,算力需求有望持续释放。3)同时,我们认为文字交互 仅为Chatgpt以及AIGC应用场景的冰山一角,语音、图片、视频等多形式 的输入输出,或将为内容创作领域带来革命性变化。4)另外,5月17日, NVIDIA创始人黄仁勋在比利时举行的ITF 2023年半导体大会上表示下一波 人工智能浪潮是“具身智能(embodied AI)”;特斯拉2023股东大会上, 人形机器人Optimus发布了最新进展,多模态模型与泛化硬件结合将对产业 带来更广阔深远的改变,也将对算力产生更高阶的需求。 Finetune精简能力具有局限性,算力需求仍将高速向上。垂类场景对可通 用大模型剪枝、蒸馏,并微调以适应各个专业场景,在降低模型参数数量, 减少部分训练数据后达到不错的效果。但以彭博、海康威视等为代表的行业 大模型仍具有百亿级别参数,且应用领域纷繁多样。伴随各行各业对AI的 深度应用,相比传统AI小模型时代,我们认为算力需求仍将高速向上。 英伟达等全球领军已落地验证,中美共振信号已现。1)海外而言,5月18 日,英伟达股价创下新高(收盘价316.78美元),较年初显著上涨;产业 方面,2023年3月的英伟达GTC大会以来,公司已推出多个AI算力大产 品。另外,2023Q1微软智能云业绩超预期,验证算力需求真实落地。2) 国内而言,以光模块、AI服务器为代表的核心算力环节,已在订单、产能 规划上展现出高景气,落地放量可期。 投资标的:英伟达、中科曙光、海光信息、寒武纪、光通信产业链、易华录、 浪潮信息、昇腾算力、景嘉微、工业富联等。 风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加 剧风险。 P.3 二、AIGC将大幅提振算力需求,具身智能等多模态场景已渐行渐近 Chatgpt月活过亿,算力成为衡量投入的关键指标。根据Similarweb的数据,2023年1月,Chatgpt累计用户超1亿,创下了互联网最快破亿应用的记录,超过了之前TikTok9个月破亿的速度。 1)访问阶段:初始投入近十亿美元,单日电费数万美元。 英伟达A100:根据OneFlow报道,目前,NVIDIA A100是AWS最具成本效益的GPU选择。 英伟达DGXA100服务器:单机搭载8片A100 GPU,AI算力性能约为5PetaFLOP/s,单机最大功率约为6.5kw,售价约为19.9万美元/台。 每日咨询量:根据Similarweb数据,截至2023年1月底,chat.openai.com网站(即ChatGPT官网)在2023/1/27-2023/2/3这一周吸引的每日访客数量高达2500万。 假设以目前的稳定状态,每日每用户提问约10个问题,则每日约有2.5亿次咨询量。 A100运行小时:假设每个问题平均30字,单个词在A100GPU上约消耗350ms,则一天共需消耗729,167个A100 GPU运行小时。 A100需求量:对应每天需要729,167/24=30,382片英伟达A100GPU同时计算,才可满足当前ChatGPT的访问量。 初始算力投入:以前述英伟达DGXA100为基础,需要30,382/8=3,798台服务器,对应3,798/7=542个机柜。则,为满足ChatGPT当前千万级用户的咨询量,初始算力投入成本约为542*140=7.59亿美元。 每月电费:用电量而言,542*45.5kw*24h=591,864kwh/日。参考Hashrate Index统计,我们假设美国平均工业电价约为0.08美元/kwh。则,每日电费约为2,369,640*0.08=4.7万美元/日。 另外,考虑Google每日搜索量已达到35亿,我们认为Chatgpt日活提升空间广阔,算力需求有望持续释放。 此外,我们认为,目前文字交互仅为Chatgpt以及AIGC应用场景的冰山一角,语音、图片、视频等多形式的输入输出,或将为内容创作领域带来革命性变化。 而更广的数据形态、更多的应用场景、更深的用户体验,亦将大幅提升支撑人工智能的算力需求,算力或迎来高速扩张时代,服务器、芯片、IDC、光通信等厂商有望核心受益。 图表2:OpenAI大模型各类场景数据量测算 过去一年机器人产业发展迅速,AI和机械技术新成果不断,对算力提出更高要求。 1)英伟达:2023年5月17日,NVIDIA创始人黄仁勋在比利时举行的ITF 2023年半导体大会上表示:下一波人工智能浪潮是“具身智能(embodied AI)”,即能够理解、推理并与物理世界互动的智能系统,包括机器人、自动驾驶汽车等。具体来说,具身智能能够通过自己的物理躯体来与环境交互感知,然后自主进行规划、决策和行动,而不是被动的等待数据投喂。 黄仁勋在会上还向观众介绍了多模态人工智能系统VIMA,许多机器人操作任务可以表示为交错语言和图像/视频帧的多模态提示,VIMA能够处理这些提示并自回归地输出电机动作。VIMA使用预训练的T5模型对多模态提示进行编码,并通过交叉注意层对机器人控制器进行调节。该控制器是一个trasformer解码器,可以预测以提示和交互历史为条件的电机命令。VIMA可以根据视觉文本提示执行任务,例如“重新排列对象以匹配此场景”;可以学习概念并采取相应的行动,例如“这是一个小部件”、“那是一个东西”,然后“把这个小部件放在那个东西里”。VIMA在NVIDIA AI上运行,其数字孪生在3D开发和模拟平台NVIDIA Omniverse中运行。黄仁勋说,了解物理学的人工智能可以学习模仿物理学并做出符合物理定律的预测。 图表3:VIMA架构 2)特斯拉:2023股东大会上,人形机器人Optimus发布了最新进展,包括电机转矩控制能力、环境探索与记忆能力、基于人类动作演示的AI训练方式;端到端的控制,提升复杂任务能力。 马斯克认为特斯拉现在做的工作,其实是被极大的低估的。未来人形机器人的需求,可能会远远超过对汽车的需求。所以马斯克个人预测,对于特斯拉长期来讲,未来长期价值可能都是Optimus给的,并且对这个预测非常有信心。 图表4:电机转矩控制能力,能敲打鸡蛋而不打破 图表5:端到端的控制能力,用机械手处理各种物体交互 三、Finetune精简能力有限,算力需求仍将高速向上 垂类场景对可通用大模型剪枝、蒸馏,并微调,以适应各个专业场景。大型语言模型能力出色,但在部署过程中由于规模大而消耗巨大的成本。谷歌研究院针对该问题提出了逐步蒸馏(Distilling Step-by-Step)范式帮助模型训练。微调指使用下游的人类注释数据升级一个预训练过的小模型。蒸馏指用较大的LLM产生的标签训练同样较小的模型。 构建的770M T5模型在一个基准任务上表现优于540B PaLM模型,且只使用了可用数据的80%。 图表6:逐步蒸馏方法与LLM模型所需要训练数据量对比 蒸馏、微调可在一定程度上缩小模型参数规模,节省算力,但微调需要昂贵的人类标签,而蒸馏需要大量很难获得的无标签数据,剪枝蒸馏能力具有一定局限性。各个专业场景下垂类预训练大模型具有其不可替代性,且模型参数量较大,训练需要大量算力投入。 许多厂商都致力于推出各类行业大模型,其规模仍大、对算力的需求依旧显著: 1)彭博社:构建具备3630亿个标签、迄今为止最大的特定领域训练数据集,训练了拥有500亿参数的金融领域的大型语言模型BloombergGPT。 2)海康威视:面向智能安防场景,利用已有业务数据,训练了百亿级参数的大模型。 这些具有百亿级别参数的大模型算力需求也会远超传统AI小模型。垂类领域预训练模型可以学习到特定领域的术语、上下文信息和任务模式,提高对该领域的语义理解和生成能力,应用范围较为广泛,因此算力需求仍将高速向上。 图表7:BloombergGPT训练层数、参数汇总 四、英伟达等全球领军已落地验证,中美共振信号已现 4.1海外:英伟达、微软等已有兑现,AIGC算力加速释放 英伟达股价明显上涨,代表性产品层出不穷。随着ChatGPT发布,轰动的人工智能领域对芯片算力产生较大需求,英伟达因可以提供训练大量文本、图像、视频训练的AI芯片,数据中心(Data Center AI GPUs)收入贡献显著,并带动股价飞涨,5月18日,英伟达股价创下新高(收盘价316.78美元),较年初显著上涨。随着AI工具持续发展,英伟达专为AI设计的图形处理器需求也会与日俱增,公司长期价值未来可期。 图表8:英伟达股价较年初呈现增长态势(收盘价:美元) 2023Q1(即FY23Q3)微软智能云业绩超预期,Q2AI将带动收入提升。大模型2023自然年伊始,微软业务实现稳健增长,2023Q1(即FY23Q3)实现营收528.6亿美元,同比增长7%;智能云业务收入220.8亿美元,同比增长16%,业绩超预期。微软在本季度推进“AI全家桶”,微软产品线的AI化将在未来的季度兑现为收益,GPT大模型在产品的应用将助力微软在AI领域和云业务实现突破和升级,落地验证进入关键期。 4.2国内:光模块、服务器等环节展现高景气 800G光模块在手订单充足,中际旭创率先落地。公司800G光模块的需求超预期,2023年以来,海外客户在云数据中心200G和400G需求有不同程度的下降,但800G需求增长迅速,特别是来自AI方面的需求大超年初预期,旭创占据了较高份额。下半年三、四季度公司会以保障订单顺利交付为主,看好明年800G更大规模的增长。。 AI服务器需求旺盛,产业龙头已在规划更大生产基地。1)受益于AIGC和chatGPT所带来的人工智能热潮,人工智能服务器承载着AI新型算力基础设施的供给水平,底层支撑的算力侧需求大增,未来行业市场规模仍将保持快速增长。2)AI算力规模持续增长是带动液冷需求的因素之一,根据财联社,浪潮信息服务器产品线人士称“AIGC火热带来AI服务器需求量的爆增,3月份我们发现AI(服务器)市场出现几倍以上增长,以前客户关注点是能不能便宜点,现在是能不能用得上。”根据财联社,天池基地年产能超10万台,公司亦在规划更大规模的液冷生产基地;成本方面,公司预计2025年“风液同价”有望实现。 投资标的 英伟达、中科曙光、海光信息、寒武纪、光通信产业链、易华录、浪潮信息、昇腾算力、景嘉微、工业富联等。 风险提示 AI技术迭代不及预期风险:若AI技术迭代不及预期,则对产业链相关公司会造成一定不利影响。 经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响,应用落地将会受限。 行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。