分析师:唐月 登记编码:S0730512030001 tangyue@ccnew.com021-50586737 Sora发布后,重新审视AI的发展走向 ——人工智能专题研究(二) 证券研究报告-行业专题研究强于大市(维持) 计算机相对沪深300指数表现 计算机沪深300 投资要点: 发布日期:2024年02月23日 资料来源:中原证券,聚源 相关报告 《计算机行业年度策略:新格局下的新机遇》2023-11-29 《计算机行业半年度策略:国产化、数字化、智能化》2023-6-27 《人工智能专题研究(一):ChatGPT的出现有望加速我国在人工智能领域政策的出台》2023-03-31 联系人:马嶔琦 电话:021-50586973 地址:上海浦东新区世纪大道1788号16楼 邮编:200122 OpenAI的重磅产品发布,再次吸引市场关注。2月15日,openAI发布了首个文生视频模型Sora,其可以根据用户的文本提示快速制作长达一分钟的逼真视频。相比于ChatGPT的文字生成图片的功能来看,Sora在对文字和图像识别和生成的基础上,又叠加了时间的维度,初步实现了对真实世界物理逻辑关系的理 28% 19% 9% 0% -9% -18% -272%023.02 -36% 2023.06 2023.10 2024.02 解。同时Sora的发布也意味着人类距离实现通用人工智能更进了一步。 大模型AI给我们带来的潜在变化包括: (1)技术迭代速度明显加快。 (2)算力和电力需求大幅提升。 (3)带来降维打击,部分行业和个人竞争壁垒随之消亡。 (4)或将带来第四次工业革命,推动国家之间竞争格局的重塑。 从芯片厂商最新财报情况来看,GPU任然是数据中心的主角,但AMD让市场更加多元化。英伟达的数据中心业务在最新一个财季里再次超出市场预期,达到184.04亿美元,同比增速409%,环比增长27%。12月AMD预测AI加速器市场规模在2027年将达到4000亿美元,较2023年8月1500亿美元的预期大幅提升。 继2023年10月美国商务部对GPU芯片禁令再一次升级以后,我们看到美国对于中国企业算力的限制还在加码过程中。在中国GPU供应面临障碍的同时,OpenAI方面正在进行一个巨型的算力工程规划。面对当前的形式,国产AI芯片已经获得了更多厂商的青睐。考虑到当前全球政治、军事形势的复杂性,我们认为海外芯片及算力供应或将继续呈现收紧趋势。因而国产GPU芯片的生存环境将得到持续改善,后续一旦在生态和生产环节形成突 破,将彻底改善其国内市场的竞争格局。 由于AI助力云迁移,Q4前4大云计算厂商的收入增速都有加快迹象。由于微软、谷歌向AI发力,其资本开支都处于了历史高位水平,2023Q4同比分别增长了55%和45%。从阿里、腾讯、百度三家国内互联网巨头来看,目前对于AI的资本投入较2021年历史高位仍有较大差距,较微软和谷歌在投入的力度和决心上仍然提升空间。 风险提示:国产芯片良率提升不及预期;人工智能技术推进不及预期。 内容目录 1.Sora出现再次引起了人们对AI广泛的关注3 2.人工智能的深远影响3 3.英伟达销量爆增,AMD大幅上调对GPU市场预期5 4.美国禁令加剧了国内AI芯片紧缺,国产芯片厂商获得更多青睐7 5.AI助力云迁移,谷歌、微软资本开支位居历史高位8 6.风险提示10 图表目录 图1:当前Sora与1年前实现效果对比3 图2:2022Q1-2023Q4英伟达单季度收入的区域分布(亿美元)5 图3:人工智能产业架构6 图4:2016Q1-2023Q4三大芯片厂商数据中心业务收入及增速(亿美元)7 图5:2014Q1-2023Q4全球前四大云计算厂商收入及增速(亿美元)8 图6:2019Q1-2023Q4美股前五大科技企业资本开支(百万美元)9 图7:2015Q2-2023Q4阿里、百度、腾讯单季度资本投入(亿元)9 表1:OpenAI的GPT大模型对比3 表2:三次工业革命4 表3:英伟达、AMD、华为人工智能芯片参数对比5 表4:华为AI芯片应用的公开信息8 1.Sora出现再次引起了人们对AI广泛的关注 OpenAI的重磅产品发布,再次吸引市场关注。2月15日,openAI发布了首个文生视频模型Sora,其可以根据用户的文本提示快速制作长达一分钟的逼真视频。 对比1年前来看,Sora当前视频的真实度和可用性取得了巨大的进步,到了可以以假乱真的程度。相比于ChatGPT的文字生成图片的功能来看,Sora在对文字和图像识别和生成的基础上,又叠加了时间的维度,初步实现了对真实世界物理逻辑关系的理解。同时Sora的发布也意味着人类距离实现通用人工智能更进了一步。 图1:当前Sora与1年前实现效果对比 资料来源:OpenAI,中原证券 2.人工智能的深远影响 从深层次影响来看,大模型AI给我们带来的潜在变化可以概况成以下几个方面: (1)技术迭代速度明显加快。从2023年初,当ChatGPT火遍全网,市场还在质疑其对产业影响的落地,到3月GPT-4的惊艳亮相,到11月GPT-4Turbo的性能提升和价格下 降,到2024年2月Sora出现后惊叹技术迭代速度的加快和对技术落后的担忧,我们看到 OpenAI一直在以超预期的方式刷新人们的认知。 模型 时间 参数 上下文 限制 训练数据截 止时间 公开的程度 备注 GPT-1 2018.6 1.17亿 开源(技术细节) GPT-2 2019.2 15亿 开源(源代码) GPT-3 2020.5 1750亿 2019.10 论文 表1:OpenAI的GPT大模型对比 GPT-3.5 2022.3 - 4K/16K 2021.6 2022.11ChatGPT基于GPT3.5推出 GPT-4 2023.3 - 8K/32K 2021.9 测试结果 2023.7向所有开发者开放使用权限 GPT-4Turbo 2023.11 - 128K 2023.4 训练数据集2023年4月 资料来源:OpenAI,中原证券 (2)算力和电力需求大幅提升。当前以大模型为支撑的人工智能,是建立在大力出奇迹的基础上的,也意味着对算力的需求呈现几何倍的增长。在这个过程中,GPU取代CPU成为了数据中心的主流需求,同时带来数据中心设备的全面升级和对电力需求的全面提升。 (3)带来降维打击,部分行业和个人竞争壁垒随之消亡。人工智能正在改变产业链的旧有格局,这意味着原有行业的竞争壁垒的消亡。因而我们也看到Sora发布以后,Adobe (ADBE.O)股价出现了大幅的调整,体现出了市场对其发展前景的担忧。影视频从业者在 Sora商用后,或将迎来职业危机。 由于大模型的模型智慧来源于对大量带标签的训练数据的认知,因而对2C领域的冲击更为显著。而2B领域由于数据的私密性,数据量相对有限,行业knowhow的壁垒更深。同 时,人工智能在人类的已知领域将形成很好的替代,而对于未知领域的探索,人类还将占据主导。 对于计算机行业而言,大模型对通用工具的格局影响会大于对细分赛道的影响。随着大模型带来的代码能力的提升,人员效率也会得到极大的提升。 (4)或将带来第四次工业革命,同时推动国家之间竞争格局的重塑。18世纪英国通过蒸汽机的改良推动了机器的普及和大工厂制的建立,开创了机器替代手工劳动的时代,并成为了全球的主导力量;19世纪六十年代以后,电机和内燃机的广泛应用,推动人类进入电气时代,让美国、德国崛起,英国丧失了垄断地位;20世纪四五十年代以来,人类进入信息时 代,美国在第三次工业革命中成为主导,处于霸主地位,发达国家和发展中国家的差距进一步拉大。 表2:三次工业革命 阶段 时间 标志 特点 第一次工业革命 1760-1840 蒸汽机 机器代替了手工劳动,人类从农耕文明向工业文明过渡 第二次工业革命 1860-1950 电机和内燃机 电力、钢铁、铁路、化工、汽车等重工业兴起,石油成为新能源 第三次工业革命 1950至今 计算机 全球信息和资源交流变得更为迅速,大多数国家和地区都被卷入到全球化进程之中,世界政治经济格局进一步确立,人类文明的发达程度也达到空前的高度 资料来源:百度百科,中原证券 在当前的人工智能浪潮中,美国以OpenAI、谷歌为代表的企业的引领下,处于绝对的主导地位。我国虽然在人工智能领域也处于全球领先地位,但是较美国在大模型领域仍有较大差距。随着美国针对人工智能领域禁令的持续加码,我们在算力方面还面临着较大的发展瓶颈。 根据英伟达财报数据,随着最新禁令的出台,Q4英伟达来自美国的收入占比进一步提升到了55%,优势更加明显,而与此同时其来自中国大陆的收入从Q3的40亿美元降低到了 19亿美元。 图2:2022Q1-2023Q4英伟达单季度收入的区域分布(亿美元) 资料来源:公司公告,Wind,中原证券(英伟达财报较正常季度延后1个月) 3.英伟达销量爆增,AMD大幅上调对GPU市场预期 目前已经上市的AI芯片中,最强大的为AMD的2023年12月上市的MI300X。而英伟 达2023年11月发布的H200预计于2024年第二季度开始供货。H200仍然采用Hopper架构,拥有141GB的内存,与前代产品H100相比,H200的容量几乎翻了一番。根据界面新闻,由于市场对其AI芯片需求旺盛,英伟达将从每两年发布一次新架构转向每一年发布一次。英伟达还将于2024年发布基于Blackwell架构的B100芯片。 国产芯片方面,2023年10月,科大讯飞表示昇腾910B能力已经基本做到可对标英伟达 A100。 A100SXM H100SXM H200SXM MI300X Ascend910 厂商 英伟达 英伟达 英伟达 AMD 华为 发布时间 2020.3 2022.3 2023.11 2023.6 2019.8 架构 Ampere Hopper Hopper CDNA3 达芬奇 工艺 7nm 4nm 4nm 5nm 7nm 晶体管数量 540亿 800亿 800亿 1530亿 最大功率 400W 700W 750W 310W 显存容量 80GB 80GB 141GB 192GB 32GB 显存带宽 2039GB/s 3.35TB/s 4.8TB/s 5.3TB/s 显存颗粒 HBM2e HBM3 HBM3e HBM3 传输速率 600GB/s 900GB/s FP64 9.7TFLOPS 34TFLOPS 34TFLOPS 表3:英伟达、AMD、华为人工智能芯片参数对比 FP64TensorCore 19.5TFLOPS 67TFLOPS 67TFLOPS FP32 19.5TFLOPS 67TFLOPS 67TFLOPS TF32 312TFlOPS 494.7TFLOPS 653.7TFLOPS TF32TensorCore 989TFLOPS 989TFLOPS BFLOAT16 989.4TFLOPS 1307.4TFLOPS BFLOAT16TensorCore 624TFLOPS 1979TFLOPS 1979TFLOPS FP16 989.4TFLOPS 1307.4TFLOPS 256TFLOPS FP16TenorCore 624TFLOPS 1979TFLOPS 1979TFLOPS FP8 1978.9TFLOPS 2614.9TFLOPS FP8TensorCore 3958TFLOPS 3958TFLOPS INT8 1978.92TOPS 2614.92TOPS 512TOPS INT8TensorCore 1248TOPS 3958TOPS 3958TOPS 资料来源:英伟达,AMD,华为,中原证券 除了硬件端的差距以外,华为和AMD这样后来者,在CUDA为代表的GPU相关软件生态方面与英伟达的差距更为明显,这也成为了当前制约其推广的核心难题。