y 证券研究报告 计算机 报告日期:2024年2月26日 政策助推算力、AI建设,Sora引领多模态热潮 ———计算机行业周报 华龙证券研究所 投资评级:推荐(维持) 最近一年走势 相对沪深300走势2024/2/23 研究员孙伯文 执业证书编号:S0230523080004邮箱:sunbw@hlzqgs.com 相关阅读 请认真阅读文后免责条款 摘要: 上周,美股科技巨头英伟达发布2024财年第四季度及全年财报,财报表现超市场预期,财报发布日后一交易日股价登上新高,再度增强全球对人工智能前景的信心。国内方面,政策和海外技术映射将成为AI产业的长期支撑。维持计算机行业“推荐”评级。 表现 1m 3m 12m 计算机 4.7 -18.9 -19.4 沪深300 8.0 -2.0 -15.0 OpenAI发布文生视频大模型Sora,引发多模态AI热潮。我们认为本次Sora的发布主要反映了两个AI方向。首先,Sora使用扩散和Transformer架构,训练过程可类比大语言模型GPT。其实现过程借助了大语言模型GPT和文生图片模型Dell·E3的技术能力,从而跑通了大模型全栈生态。证明大模型训练逻辑可迁移、可类比,表明了大模型底座核心技术的重要性。其次,Sora的表现形式是文生视频大模型,但基础设计理念是让大模型理解真实世界。因此,Sora也可以看做对“世界模型”的一次探索。而具备多模态特征的“世界模型”可能是实现AGI的关键一环。从Sora对国内各行业映射的角度看,我们建议关注算力、多模态AI、传媒、游戏等行业。个股方面建议关注万兴科技(300624.SZ)、因赛集团(300781.SZ)、卡莱特(301391.SZ)、神州泰岳(300002.SZ)、创业黑马(300688.SZ)。 国务院国资委召开“AI赋能产业焕新”中央企业人工智能专题推进会。会议强调,中央企业要把发展人工智能放在全局工作中统筹谋划,深入推进产业焕新,加快布局和发展人工智能产业。会议提出,要加快建设一批智能算力中心和开展AI+专项行动。会上,10家中央企业签订倡议书,表示将主动向社会开放人工智能应用场景。我们认为国产算力底座将加速推进,AI+应用有望加速赋能千行百业。个股方面建议关注神州数码(000034.SZ)、中兴通讯(000063.SZ)、浪潮信息 (000977.SZ)、海光信息(688041.SH)、中科曙光(603019.SH)。 1 风险提示:国产算力建设不及预期;所引用数据资料的误差风险;AI应用落地速度不及预期;国产大模型迭代速度不及预期;重点关注公司业绩不达预期;政策标准出台速度不及预期;创业板、科创板股票风险等级为R4,仅供符合本公司适当性管理要求的客户使用。 正文目录 1一周市场表现3 2行业要闻4 3重点公司公告5 4本周观点6 4.1Sora:从视频学习中理解和模拟真实世界6 4.2多模态或将进一步加剧算力竞赛8 5风险提示10 图目录 图1:申万一级行业周涨跌幅一览3 图2:计算机股票周涨幅前五3 图3:计算机股票周跌幅前五3 图4:Sora根据提示词生成的视频6 图5:Sora基于DiT架构的视频生成过程7 图6:Sora所使用的patch生成过程7 图7:重述提示词技术示意图8 图8:不同计算量下Sora输出的视频质量对比9 表目录 表1:重点关注公司及盈利预测10 1一周市场表现 2024年2月19日-2月23日,申万计算机指数上涨11.59%。板块个股涨幅前五名分别为维海德 (301318.SZ)、ST有棵树(300209.SZ)、当虹科技 (688039.SH)、中威电子(300270.SZ)、思创医惠 (300078.SZ)。板块个股跌幅前五名分别为*ST慧辰 (688500.SH)、中望软件(688083.SH)、柏楚电子 (688188.SH)、萤石网络(688475.SH)、卡莱特 (301391.SZ)。 图1:申万一级行业周涨跌幅一览 资料来源:Wind,华龙证券研究所 图2:计算机股票周涨幅前五图3:计算机股票周跌幅前五 资料来源:Wind,华龙证券研究所资料来源:Wind,华龙证券研究所 2行业要闻 2024年2月19日,国务院国资委召开“AI赋能产业焕新”中央企业人工智能专题推进会。国务院国资委党委书记、主任张玉卓在会上讲话强调,要深入学习贯彻习近平总书记关于发展人工智能的重要指示精神,推动中央企业在人工智能领域实现更好发展、发挥更大作用。会议强调,中央企业要把发展人工智能放在全局工作中统筹谋划,深入推进产业焕新,加快布局和发展人工智能产业。要夯实发展基础底座,把主要资源集中投入到最需要、最有优势的领域,加快建设一批智能算力中心,进一步深化开放合作,更好发挥跨央企协同创新平台作用。开展AI+专项行动,强化需求牵引,加快重点行业赋能,构建一批产业多模态优质数据集,打造从基础设施、算法工具、智能平台到解决方案的大模型赋能产业生态。会上,有关人工智能头部企业及中央企业代表作了交流发言。10家中央企业签订倡议书,表示将主动向社会开放人工智能应用场景。(资料来源:国资委网站) 2024年2月19日,国家统计局发布《关于开展全国数据资源调查的通知》。为贯彻落实《数字中国建设整体布局规划》工作部署,摸清数据资源底数,加快数据资源开发利用,更好发挥数据要素价值,国家数据局、中央网络安全和信息化委员会办公室、工业和信息化部、公安部联合开展全国数据资源情况调查,调研各单位数据资源生产存储、流通交易、开发利用、安全等情况,为相关政策制定、试点示范等工作提供数据支持。调查对象包括1)省级数据管理机构、工业和信息化主管部门、公安厅(局);2)各省重点数据采集和存储设备商、消费互联网平台和工业互联网平台企业、大数据和人工智能技术企业、应用企业、数据交易所、国家实验室等单位;3)中央企业;4)行业协会商会;5)国家信息中心。 2024年2月21日,工信部印发工业领域碳达峰碳中和标准体系建设指南的通知。提出要创新驱动、数字赋能。鼓励工业领域的低碳技术创新和管理创新,推动将低碳新技术新工艺融入相关标准,加快低碳创新技术的推广应用。围绕5G、工业互联网、人工智能等新一代信息技术在工业低碳领域的应用创新,加快相关标准研制,以数字化、智能化赋能绿色化,培育壮大低碳发展 新动能。 3重点公司公告 【朗玛信息】2024年2月19日,据朗玛信息公司公告,国家互联网信息办公室发布第四批深度合成服务算法备案信息的公告,贵阳朗玛信息技术股份有限公司“39健康医疗内容生成算法”通过深度合成服务算法备案。 【新炬网络】2024年2月19日,新炬网络发布关于以集中竞价交易方式回购股份方案的公告,公司拟用于回购的资金总额不低于人民币5,000.00万元(含), 不超过人民币10,000.00万元(含),具体回购资金总额以回购期满时实际回购的资金为准。按回购价格上限 34.58元/股(含)进行测算,若全部以最高价回购,预计回购数量约为1,445,923股-2,891,844股,约占公司总股本的1.2399%-2.4798%。 【炬芯科技】2024年2月19日,炬芯科技发布2023年度业绩快报公告。2023年度,公司实现营业收入52,009.94万元,同比增长25.41%;实现归属于母公司所有者的净利润6,505.86万元,同比增长21.04%;归属于母公司所有者的扣除非经常性损益的净利润5,112.64万元,同比增长64.16%。 【神州泰岳】2024年2月21日,神州泰岳发布2023 年度业绩快报。报告期内,公司营业总收入596,493.04 万元,较上年同期增长24.11%;营业利润105,263.83 万元,较上年同期增长69.09%;利润总额105,220.04万元,较上年同期增长67.21%;归属于上市公司股东的净利润89,317.83万元,较上年同期增长64.82%。 【启明星辰】2024年2月22日,启明星辰发布2023 年度业绩快报。报告期内,公司实现营业收入45.29亿元,较上年同期增长2.07%;实现归属于上市公司股东的净利润7.35亿元,较上年同期增长17.44%。 【中科曙光】2024年2月24日,中科曙光发布2023 年度业绩快报公告。报告期内,公司实现营业收入 143.54亿元,较上年同期增长10.35%;利润总额21.84亿元,较上年同期增长14.62%;归属于上市公司股东净利润18.38亿元,较上年同期增长19.00%,归属于上市公司股东的扣除非经常性损益的净利润12.71亿元,较 上年同期增长10.43%。 4本周观点 4.1Sora:从视频学习中理解和模拟真实世界 2024年2月15日,OpenAI发布文生视频大模型Sora。据OpenAI介绍,Sora可以按照用户指令生成长达一分钟的视频,不仅能够生成具有多个角色、特定类型的运动以及准确细节的复杂场景,还能够理解物体在物理世界中的存在方式。我们认为Sora的发布加速了多模态AI的进程,同时也是人类社会迈向AGI时代的一次有效探索。 真实世界理解或是AGI时代到来的基石。Sora是OpenAI团队在教授人工智能理解和模拟运动中的物理世界的一次尝试,他们希望通过训练模型来帮助人们解决真实世界交互的问题,即以模型充当“世界模拟器”。而“世界模拟器”是通向AGI的铺路石。从实现路径来看,人工智能对虚拟物体、虚拟世界的模拟和构建需要建立在对真实世界的理解之上。 图4:Sora根据提示词生成的视频 资料来源:OpenAI官网,华龙证券研究所 Sora证明DiT架构在视频生成领域有效。Sora使用的是diffusion+transformer(DiT)架构。Diffusion架构用于训练基于输入的噪音Patch(及像输入的指令这样的条件信息),预测原始“干净”Patch的能力。Transformer 架构则在多个领域展现出了出色的扩展性能,此前已被用于语言建模、机器视觉和图像生成等领域。 图5:Sora基于DiT架构的视频生成过程 资料来源:OpenAI官网,华龙证券研究所 Sora在训练方法上借鉴了大语言模型。其训练中使用的patch可以类比大语言模型的token。大语言模型的成功可以部分归功于token的使用,这些token统一了文本代码、数学和各种自然语言的不同表现形式。而Sora作为视频生成类模型,沿袭了大语言模型对数据处理方法上的思路。大语言模型有文本token,而Sora有视觉patch。Patch是一种高度可扩展且有效的视频数据表示形式,可用于在不同类型的视频和图像上训练生成模型。 图6:Sora所使用的patch生成过程 资料来源:OpenAI官网,华龙证券研究所 大模型全栈生态是Sora的优势所在。Sora在训练和推理过程中,引入了GPT和Dell-E3的技术能力。GPT是大语言模型的代表,而DALLE3是OpenAI基于 图7:重述提示词技术示意图 ChatGPT的文字生成和图像生成模型。训练文本生成视频需要大量带有相应文本字幕的视频。OpenAI将DALL·E3中的重述提示词技术引入到大模型训练中。首先,团队先训练一个高度描述性的字幕生成器模型,然后使用它为训练集中的所有视频生成文本字幕。按此方法,以高度描述性视频字幕为基础训练可以提高文本保真度以及视频的整体质量。与DALL·E3类似,团队还利用GPT将简短的用户提示转换为较长的详细字幕,然后发送到视频模型。这使得Sora能够生成准确遵循用户提示的高质量视频。 资料来源:OpenAI官网,华龙证券研究所 4.2多模态或将进一步加剧算力竞赛 算力资源对Sora的输出效果具有直观影响。OpenAI展示了训练过程中具有固定种子和输入的视频样本的比较。随着训练计算的增加,样本质量显著提高。从算力需求角度看,多模态大模型在输入和输出数据量方面有显著提升。算力将成为影响多模态大模型性能的关键因素之一。