您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:左手算力,右手数据 - 发现报告
当前位置:首页/行业研究/报告详情/

左手算力,右手数据

信息技术2023-04-09宋嘉吉、黄瀚、邵帅国盛证券娇***
AI智能总结
查看更多
左手算力,右手数据

近期AIGC持续成为市场热点,本周,我们聚焦算力建设与数据要素。算力是当代生产力。算力支撑着算法和数据,算力规模能否满足AI的训练和推理,直接影响着AI的发展进程。目前高性能计算网络中的内部数据交换时长大于计算时长,数据交换性能制约了计算性能,交换网络中的光通信设备、光模块、光器件亟需升级扩容。通过对英伟达新一代高性能计算中心网络架构进行测算,我们认为光模块在本轮升级浪潮中具有显著的增长弹性。 云算力有望打造IDC行业的第二增长曲线。AIGC的爆发,有望缩短IDC的投资回收周期。同时,短短几个月,ChatGPT的中心算力资源已经宣布告急,我们建议持续关注云算力底座建设。 AIGC算法日新月异,更加证明数据要素在当今的重要性。Meta发布基础模型SAM并开源。SAM已在1100万张图片和11亿个掩码的数据集上进行了训练,具有超强的自动识别、切割功能。我们认为,SAM使用的1100万张图片训练集仅是一个开始,未来随着用户数量增加,SAM的图片训练量和分割掩码体量会呈指数级增长,因此数据要素的价值应得到持续关注。 算力: 光通信:新易盛300502、天孚通信300394、中际旭创300308。 云算力:光环新网300383、奥飞数据300738、数据港603881、润泽科技 300442。 数据要素: 运营商:中国电信601728、中国移动600941、中国联通600050。 数据可视化:浩瀚深度688292、恒为科技603496、中新赛克002912。 谷歌公布新一代AI超算,称比英伟达A100更快、更节能。谷歌近日公开了一些新细节,展示了用于训练人工智能模型的超级计算机,称其比英伟达A100芯片的系统更快、更节能。谷歌设计了自己的定制芯片,称为Tensor Processing Unit(TPU),并将这些芯片应用于90%以上的AI训练工作。 IDC预计亚太地区公共云服务市场规模2026年将达到1536亿美元。根据IDC最近发布的亚太(不包括日本)公共云服务市场预测,该地区公共云服务市场规模将在2026年达到1536亿美元。IDC预计,随着云迁移继续加速,2022年亚太地区(不包括日本)公共云服务市场同比增长率为25.9%。 风险提示:AI发展不及预期,算力需求不及预期。 重点标的 股票代码 1.投资策略:左手算力,右手数据 本周核心推荐: 算力: 光通信:新易盛300502、天孚通信300394、中际旭创300308。 云算力:光环新网300383、奥飞数据300738、数据港603881、润泽科技300442。 数据要素: 运营商:中国电信601728、中国移动600941、中国联通600050。 数据可视化:浩瀚深度688292、恒为科技603496、中新赛克002912。 近期AIGC持续成为市场热点,本周,我们聚焦算力建设与数据要素。算力是当代生产力。算力支撑着算法和数据,算力规模能否满足AI的训练和推理,直接影响着AI的发展进程。而目前高性能计算网络中的内部数据交换时长大于计算时长,数据交换性能制约了计算性能,交换网络中的光通信设备、光模块、光器件亟需升级扩容。通过对英伟达新一代的高性能计算中心的网络架构进行测算,我们认为光模块在本轮升级浪潮中具有显著的增长弹性。 云算力有望打造IDC行业的第二增长曲线。AIGC的爆发,有望缩短IDC的投资回收周期。同时,短短几个月,ChatGPT的中心算力资源已经宣布告急,我们建议持续关注云算力底座建设。 AIGC算法日新月异,更加证明数据要素在当今的重要性。Meta发布基础模型SAM并开源。SAM已在1100万张图片和11亿个掩码的数据集上进行了训练,具有超强的自动识别、切割功能。我们认为,SAM使用的1100万张图片训练集仅仅是一个开始,未来随着用户数量增加,SAM的图片训练量和分割掩码体量会呈指数级增长,因此数据要素的价值应得到持续关注。 继续跟踪: (1)光通信:太辰光300570、华工科技000988、德科立688205、源杰科技688498。 (2)云算力:科华数据002335。 (3)算力上游:工业富联601138、寒武纪688256、中兴通讯000063、紫光股份000938、锐捷网络301165。 (4)运营商BOSS系统:东方国信300166、天源迪科300047、亚信科技1675.HK。 2.行情回顾:通信板块表现上涨,光通信表现最佳 本周(2023年4月3日-2023年4月7日)大盘收于3328点。各行情指标从好到坏依次为:创业板综>万得全A>万得全A(除金融,石油石化)>沪深300>上证综指>中小板综。通信板块上涨,表现优于大盘。 图表1:通信板块上涨,细分板块中光通信表现相对最优 从细分行业指数看,光通信、量子通信、运营商上涨23.0%、17.3%、7.2%,表现优于通信行业平均水平,移动互联、区块链、物联网、卫星通信、云计算、通信设备上涨5.7%、4.8%、4.5%、4.4%、3.7%、2.7%,表现劣于通信行业平均水平。 本周受益光通信概念,新易盛上涨44.74%,领涨板块。受益AIGC+游戏概念,富春股份上涨31.61%,受益光通信概念,天孚通信上涨30.51%、博创科技上涨28.20%,受益AIGC概念,神州泰岳上涨27.81%。 图表2:本周新易盛领涨通信行业 3.周专题:左手算力,右手数据 近期AIGC持续成为市场热点,本周,我们聚焦算力建设与数据要素。 算力是当代生产力。正如同训练一个优秀运动员需要优质的训练场地,让运动员发挥应有实力需要良好的比赛场地,算力资源就是AI模型的“训练场”和“比赛场”。算力支撑着算法和数据,算力规模能否满足AI的训练和推理,直接影响着AI的发展进程。而目前高性能计算网络中的内部数据交换时长大于计算时长,数据交换性能制约了计算性能,交换网络中的光通信设备、光模块、光器件亟需升级扩容。通过对英伟达新一代的高性能计算中心的网络架构进行测算,我们认为光模块在本轮升级浪潮中具有显著的增长弹性。 图表3:英伟达DGXH100网络拓扑 云算力有望打造IDC行业的第二增长曲线。AIGC的爆发,有望缩短IDC的投资回收周期。同时,短短几个月,ChatGPT的中心算力资源已经宣布告急,我们建议持续关注云算力底座建设。国内IDC厂商不遑多让,正在积极布局AI算力,例如光环新网已经可为人工智能生成内容所需的算力网络提供必需的基础设施服务;奥飞数据一直为AIGC应用和互联网厂商提供基础算力服务,与国内相关算法厂商深度合作。 运营商在AI时代地位特殊,不仅掌握算力中心、接入网和传输网,还有着“数据管道管理者”的身份,是数据要素中军。培养优秀运动员需要优质的营养摄入,AI训练亦然,需要优质、规模可观的数据作为训练资源。同时,运营商不仅可以结合数据可视化、BOSS等产业链汇聚、分析优质数据,更可以利用规模优势消除“数据孤岛”的问题。运营商构建算力网络的同时,会对两条产业链:数据流量监控者——数据可视化,以及数据采集、清洗、分析者——BOSS系统进行全面升级。 图表4:运营商数据采集与BOSS系统 AIGC算法日新月异,更加证明数据要素在当今的重要性。4月5日,Meta发布基础模型Segment Anything Model(SAM)并开源。SAM已在1100万张图片和11亿个掩码的数据集上进行了训练,具有超强的自动识别、切割功能。在这之前,基于深度学习、人工标记的CV算法已经深度赋能千行百业,如今在AI加持下,没有专业计算机背景的人也可以调用SAM融合在医疗、农业、气象、天文、媒体等实际业务中。我们认为,SAM使用的1100万张图片训练集仅仅是一个开始,未来随着用户数量增加,SAM的图片训练量和分割掩码体量会呈指数级增长,因此数据要素的价值应得到持续关注。 4.谷歌公布新一代AI超算,称比英伟达A100更快、更节能 C114讯,Alphabet旗下的谷歌近日公开了一些新细节,展示了用于训练人工智能模型的超级计算机,称其比英伟达A100芯片的系统更快、更节能。 谷歌公司设计了自己的定制芯片,称为Tensor Processing Unit(TPU),并将这些芯片应用于90%以上的人工智能训练工作。这个过程通过模型对数据进行训练,以提高其在类似人类文本响应或生成图像等任务中的实用性。 目前,谷歌TPU已经进入第四代。谷歌公司在周二发布了一篇科学论文,详细介绍了如何利用自己开发的定制光开关将4000多个芯片连接成一个超级计算机。 对于构建AI超级计算机的公司来说,改善这些连接已经成为竞争的关键点,因为所谓的大规模语言模型正在不断增大,已无法在单个芯片上存储,而这些模型正驱动着谷歌的Bard或OpenAI的ChatGPT等技术。 这类模型必须分布在成千上万的芯片之间,然后这些芯片要在数周或更长时间内协同工作来训练模型。谷歌的PaLM模型,是迄今为止公开披露的最大语言模型,它通过分布在两台4000芯片的超级计算机上进行了50天的训练。 谷歌表示,其超级计算机可以轻松地动态重新配置芯片之间的连接,有助于避免故障并进行性能优化。 “电路交换使得我们能够轻松避开故障组件,”谷歌高级研究员Norm Jouppi和谷歌杰出工程师David Patterson在一篇关于该系统的博客文章中写道。“这种灵活性甚至使我们能够改变超级计算机互联网络的拓扑结构,以加速ML(机器学习)模型的性能。” 虽然谷歌直到现在才公开其超级计算机的详细信息,但它自2020年以来就已经在俄克拉荷马州梅斯县的数据中心内运行。谷歌表示,初创公司Midjourney使用该系统来训练其模型,该模型在输入几个词的文本后可以生成新的图像。 谷歌在论文中表示,与相同规模的系统相比,它的超级计算机比基于英伟达A100芯片的系统更快1.7倍,更节能1.9倍。据了解,A100芯片早于第四代TPU面市。 谷歌表示,它没有将第四代TPU与英伟达当前旗舰H100芯片进行比较,因为H100是在谷歌这款芯片应用后上市的,并且采用了更新的技术。 谷歌暗示正在研发一款新的TPU,将与英伟达H100竞争,但没有提供详细信息。Jouppi告诉媒体,谷歌有“充足的未来芯片储备”。 我们认为,AI浪潮下,芯片间互联的重要性对于构建AI超算的公司逐渐凸显,第四代TPU推出有望帮助谷歌获得竞争优势。 5.CINNO Research:2022年中国半导体产业投资额达1.5万亿元人民币芯片设计占比37.3% C114讯,根据CINNO Research统计数据显示,2022年中国(含台湾省)半导体项目投资金额高达1.5万亿元人民币,半导体产业延续高投资态势。随着对半导体产业的大力支持和投资,以及半导体企业的快速发展,为中国在半导体领域的自主可控能力提供了强有力的支撑。 图表5:2022年中国半导体产业投资项目分布情况 从半导体行业内部资金细分流向来看:芯片设计投资金额超5,600亿人民币,占比约为37.3%;晶圆制造投资金额超3,800亿人民币,占比约为25.3%;材料投资金额超3,000亿人民币,占比约为20.1%;封装测试投资金额超1,300亿人民币,占比约为8.9%; 设备投资金额约360亿人民币,占比约为2.4%。 半导体材料投资项目领域主要以硅片、SiC/GaN、IC载板、电子化学品及电子气体项目为主,合计约占项目规模的71.3%。 从半导体产业投资地域分布来看,共涉及28个省市(含直辖市)地区,其中投资资金占比10%以上的有台湾、江苏、广东三个地区;投资资金排名前五个地区占比约为总额的65.8%;从内外资分布看,内资资金占比为75.8%,台资占比为23.8%,日韩资金占比为0.38%。 细分到半导体行业材料领域,根据CINNO Research统计数据,2022年中国(含台湾)半导体行业投资资金按项目类别来看硅片投资占比最高,占比约为34.7%,投资金额超1,000亿人民币;投资