证 券 研2024年04月22日 究 报Adobe携手OpenAI重塑视频编辑生态,Gaudi3 告芯片引领AI算力新突破 推荐(维持)投资要点 —计算机行业周报 分析师:宝幼琛S1050521110002baoyc@cfsc.com.cn 行业相对表现 表现 1M 3M 12M 计算机(申万) -16.1 -1.0 -33.7 沪深300 -0.4 9.7 -12.4 市场表现 (%)计算机沪深300 20 10 0 -10 -20 -30 -40 -50 资料来源:Wind,华鑫证券研究 相关研究 1、《计算机行业周报:两会布局新质生产力,AI、数据要素、算力逐渐成为关键元素》2024-03-11 2、《计算机行业周报:AI浪潮持续升温,重视算力与数据要素机遇》2024-03-04 3、《计算机行业点评报告:Sora开启视频生成领域新篇章,科技巨头加大AI芯片投入》2024-02-18 行业研究 ▌算力:租赁价格稳定,英特尔发布Gaudi3芯片 跟踪数据显示,各算力租赁平台的显卡租赁价格环比持平。产业动态上,英特尔于4月9日发布了新一代Gaudi3AI芯片,与Gaudi2相比,Gaudi3在BF16AI计算能力上提升了4倍,内存带宽提升了1.5倍,网络带宽提升了2倍; 与英伟达H100相比,Gaudi3运行人工智能模型的速度为1.5倍,支持AI模型的推理能力平均提高了50%,能效平均提高40%。 ▌AI应用:秘塔AI访问量现象级增长,Adobe首次宣布与OpenAI等第三方大模型合作 本周访问量前三位分别为ChatGPT(420.8M)、Bing (332.7M)和Discord(251.9M);环比增速前三分别为Kimi (9.13%)、Bing(5.09%)和Zoom(4.93%)。本月AI应用榜中,环比增速位前三位分别为秘塔AI搜索(551.36%)、Kimi(Moonshot)(321.58%)和Glarity(209.04%)。 4月15日全球多媒体巨头Adobe在官网宣布,将OpenAI的Sora、Pika、Runway等集成在视频剪辑软件PremierePro中。Adobe的新功能主要集中在通过AI增强的视频生成和编辑能力,允许用户添加或移除视频中的对象,生成连续性视频,确保内容的自然过渡。 ▌AI融资动向:云数据安全公司Cyera、RISC-V架构芯片公司Rivos获最高融资额 本周AI初创公司的融资中,Cyera/Rivos融资额最高,分别为3/2.5亿美元,其中Cyera的核心业务是云数据安全解决方案,公司产品包括自动数据存储发现、敏感数据清点和分类、数据安全态势管理等。Rivos则是专注于设计和生产基于RISC-V架构的芯片,本次融资用于研发、设计和量产满足生成式AI和数据分析工作负载的RISC-V加速器。 ▌投资建议 目前正进入季报披露期,部分公司的超预期表现或将提振市场信心。此外,需重视四大云厂商(微软、谷歌、亚马逊、Meta)的资本开支情况,或对AI市场需求产生决定性影响。下一步,应积极关注Llama3模型的表现,尤其是预计于年中 发布的多模态版本,或将大幅改变人工智能技术的应用格局。建议关注以AI为核心的龙头厂商科大讯飞、有望迎来需求爆发的AI应用金桥信息等。 ▌风险提示 1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。 2024-04-22 EPS PE 重点关注公司及盈利预测 公司代码名称 股价 2022 2023E 2024E 2022 2023E 2024E 投资评级 002230.SZ科大讯飞 44.60 0.24 0.45 0.65 185.83 99.11 68.62 买入 002368.SZ太极股份 23.27 0.64 0.79 1.01 36.36 29.46 23.04 买入 002649.SZ博彦科技 9.53 0.52 0.91 1.16 18.33 10.47 8.22 买入 603918.SH金桥信息 12.94 0.05 0.33 0.49 258.80 39.21 26.41 买入 资料来源:Wind,华鑫证券研究 正文目录 1、算力动态:租赁价格稳定,英特尔发布GAUDI3芯片4 1.1、数据跟踪:算力租赁本周价格环比持平4 1.2、产业动态:英特尔发布新一代Gaudi3芯片,性能能效加速突破4 2、AI应用动态:秘塔AI访问量现象级增长,ADOBE首次宣布与OPENAI等第三方大模型合作7 2.1、流量跟踪:本周ChatGPT访问量环比+3.5%、3月秘塔AI访问量环比+551.4%7 2.2、产业动态:Adobe首次宣布与OpenAI等第三方大模型合作9 3、AI融资动向:云数据安全公司CYERA、RISC-V架构芯片公司RIVOS获最高融资额12 4、行情复盘13 5、投资建议14 6、风险提示15 图表目录 图表1:本周算力租赁情况4 图表2:英特尔发布Gaudi3AI芯片4 图表3:英特尔Gaudi3与英特尔Gaudi2加速器功能的比较5 图表4:Gaudi3与H100在LLM训练和推理性能的对比图6 图表5:中国地区和非中国地区Gaudi3产品参数对比图6 图表6:2024.4.10-2024.4.16AI相关网站流量7 图表7:2024年3月AI应用榜8 图表8:只需要输入文本提示“夜雨中的城市风景”就能生成视频素材9 图表9:只需要输入文本提示“以司机角度看夜景”就能生成视频素材10 图表10:只需要拖动视频的定格静态帧,任意拖拉即可,其他的补充内容由AI生成10 图表11:点击“添加物体”按钮,然后选择目标区域,输入提示词,原本只有少数的钻石填满了整个箱子 ..................................................................................11 图表12:只需点击就能自动识别出整个物体,识别完成后一键就能完成物体的消除,相应区域的背景也会自动补全11 图表13:在手腕上替换一块新的手表,能够跟随手腕移动,视频里的其他部分则没有受到影响11 图表14:无缝添加帧以延长剪辑时长11 图表15:本周AI初创公司的融资动态12 图表16:本周指数日涨跌幅13 图表17:本周AI算力指数内部日跌涨幅度排名14 图表18:本周AI应用指数内部日跌涨幅度排名14 图表19:重点关注公司及盈利预测15 1、算力动态:租赁价格稳定,英特尔发布 Gaudi3芯片 1.1、数据跟踪:算力租赁本周价格环比持平 本周算力租赁价格环比持平。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为9.00元/时,阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16核+256G价格为9.00元/时,或为缺货原因,该配置的租赁较为紧张。 图表1:本周算力租赁情况 显卡配 置 CPU 内存磁盘大小(G) 平台名称 价格(每 小时) 价格环比上周 A100-40G1696可自定,额外收费腾讯云28.64/元0.00%12核94G可自定,额外收费阿里云31.58/元0.00% A100-80G 13128系统盘:20G数据盘:50GB 恒源云9.00/元0.00% 16核125G可自定,额外收费阿里云34.74/元0.00% A800-80G16256系统盘:20G 数据盘:50GB 恒源云9.00/元- 资料来源:腾讯云,阿里云,恒源云,华鑫证券研究所 1.2、产业动态:英特尔发布新一代Gaudi3芯片,性能能效加速突破 4月9日,英特尔发布了新一代Gaudi3AI芯片,并将于二季度首先面向戴尔、惠普、联想、超微电脑等设备制造商(OEM)出货,计划三季度大范围上市。 图表2:英特尔发布Gaudi3AI芯片 资料来源:Intel,华鑫证券研究所 Gaudi3性能大幅提高。Gaudi3采用了台积电5nm工艺,拥有8个矩阵数学引擎、64个张量内核、96MBSRAM和128GBHBM2e内存,以及16个PCIe5.0通道和24个200GbE链路。基于此架构,Gaudi3加速器的计算、内存带宽和架构效率显著提高,其FP8和BF16计算量为1.8PFlops,内存容量为128GB,HBM带宽达到3.7TB/s。与Gaudi2相比,Gaudi3在BF16AI计算能力上提升了4倍,内存带宽提升了1.5倍,网络带宽提升了2倍,使得Gaudi3能够更高效地处理大规模的AI工作负载。 图表3:英特尔Gaudi3与英特尔Gaudi2加速器功能的比较 IntelGaudi3 Accelerator IntelGaudi2 Accelerator Feature/ Product BF16MMETFLOPs4321835 FP8MMETFLOPs BF16VectorTFLOPs 8651835 1128.7 MMEUnits28 TPCUnits2464 HBM CapacityHBM Bandwidth On-dieSRAMCapacity On-dieSRAMBandwidth 96GB128GB 2.46TB/s3.7TB/s 48MB96MB 6.4TB/s12.8TB/s Networking600GB/sbidirectional 1200GB/s bidirectional HostInterfacePCleGen4X16PCleGen5X16 HostInterfacePeakBW 64GB/s(32GB/sperdirection) 128GB/s (64GB/sperdirection) Media8Decoders14Decoders 资料来源:Intel官网,华鑫证券研究所 Gaudi3性能已全面超越H100。与英伟达H100相比,Gaudi3的训练性能高出1.7倍,支持AI模型的推理能力平均提高了50%,能效平均提高40%。基准测试中,Gaudi3可以在Llama2-7B、Llama2-13B模型中将训练时间缩短到英伟达H100的一半,同时推理吞吐量也比后者平均高出了50%。此外,英特尔强调,与英伟达的芯片相比,Gaudi3的功耗更低。 图表4:Gaudi3与H100在LLM训练和推理性能的对比图 Model&ExecutionParameters H100 IntelGaudi3OAM Model OAM(#Devices) InputLength OutputLength BatchSizel ReportedThroughput!(tps) BatchSize ProjectedThroughput(tps) Gaudio3H100Speedup(x) LLAMA-7B 1 128 128 896 20,241 1,536 21,201 1.0x 1 128 2048 120 6,922 220 7,934 1.1x 1 2048 128 64 2,170 120 2,002 0.92x 1 2048 2048 56 2,816 120 3,168 1.1x LLAMA-7OF 2 128 128 1,024 6,538 4,096 5,794 0.9x 4 128 2048 512 10,872 1,024 16,128 1.5x 2 2048 128 96 694 220 655 0.9x 2 2048 2048 64 2040 256 3,382 1.7x Falcon-180B 4 128 128 512 4192 4,096 511 1.2x 8 128 2048 1,024 6688 4,096 17,79