从技术路线谈AI视频的未来发展 ——计算机行业研究周报 行业研 究 行业研究周 报 申港证券股份有限公司证券研究报 告 投资摘要: 本周我们从技术路线来对近期爆火的AI视频进行展望。 自Pika爆火出圈后,越来越多的AI视频软件接踵而至,Pika的测评也出现了明显的口碑分化,市场主流观点认为视频生成领域也迎来了GPT时刻。 从AI视频的技术迭代的路线看,我们认为: 从参与玩家的类型来看,整体是科技大厂居多,并没有出现如文生图模型一样的的现象,背后的原因在于文生视频的门槛较高。 从训练数据层来看,AI视频训练数据集的呈现跨模态的形式,以Runway的视频生成模型Gen-2为例,训练数据包括2.4亿张图片、640万个视频剪辑片段以及数亿个学习示例。 从形式来看,目前大多数模型厂商在文生视频上以闭源路线居多,其原因在于文生视频对算力及模型的工程化能力都很高。 文生视频模型背后其实有两条技术路线:一条是从文本或图像生成中得到广泛的应用,基于Transformer架构的技术路线,而另一条则是基于我们在之前的周报中有所提及的扩散模型,两条技术交替,目前扩散模型占据主流。 Google发布的Transformer架构已经在许多不同领域取得了较大的成功,但实际上包括最近的Pika在内,视频生成的主导范式依然是扩散模型。其原因在于Transformer中的注意力机制的内存需求会随输入序列长度而二次方增长,在处理视频这样的高维信号时,这样的增长模式会让计算成本成倍增加。 我们认为两种技术路线的融合可能会推动视频生成技术的发展,并对AI行业的争格局产生影响。斯坦福大学AI科学家李飞飞团队与谷歌合作,推出了视频生 成模型W.A.L.T,该模型成功地将Transformer架构整合到了隐视频扩散模型中,隐扩散模型(LDM)可在源自自动编码器的更低维隐空间中运行,从而降低计算需求。 尽管通用大模型正以飞快的速度发展和迭代,但我们认为在文生视频领域距离GPT时刻的来临仍需一定的时间,预计明年二季度会出现下一个出圈的AI视频应用。 目前AI视频有两个较大的门槛,一是算力的掣肘,视频领域对算力需求更高;另一方面是竞争环境的激烈,当前头部科技巨头基本都已入局,只是产品尚未全面公测。 从W.A.L.T模型的例子来看,我们不能忽视算法的演进对AI视频领域的影响,同时也需注意轻量化的视频制作产品最终面向的是非专业人群,这也意味着能否以差异化优势吸引用户也是成功的关键。 建议重点关注:视觉算法领先的虹软科技、当虹科技、格灵深瞳,大模型侧的科大讯飞,应用侧的金山办公、万兴科技、福昕软件等。 市场回顾: 本周申万计算机指数跌幅较大,下跌1.48%,在申万一级行业中排名 24/31。 本周申万计算机行业指数前十大权重股整体除德赛西威、海康威视、金山办公外均为下跌,其中大华股份、中科曙光、浪潮信息回调幅度较大。 本周计算机板块涨幅前十大个股:苏州科达、云鼎科技、恒银科技、方直科技、丝路视觉、赛为智能、御银股份、维海德、软通动力及汉王科技。 申万计算机行业指数当前滚动市盈率为63.54,近五年分位值67.72%。 风险提示:政策落地不及预期风险、技术落地不及预期、宏观经济波动风险等。 评级增持(首次) 2023年12月18日 曹旭特分析师 SAC执业证书编号:S1660519040001 行业基本资料 股票家数331 行业平均市盈率112.4 市场平均市盈率10.7 56% 42% 28% 14% 0% -14% -28% 2022-122023-032023-062023-092023-12 计算机 沪深300 行业表现走势图 资料来源:iFind,申港证券研究所 相关报告 1、《计算机行业研究周报:谷歌推出 Gemini模型AI演进势不可挡》2023-12-11 2、《计算机行业研究周报:龙芯发布新一代处理器致力构建产业新生态》2023-12-04 3、《计算机行业研究周报:微软Ignite全球技术大会举行继续引领AI变革与创新》2023-11-20 内容目录 1.每周一谈:从技术路线谈AI视频的未来发展3 1.1投资策略4 2.板块回顾5 3.本周要闻6 3.1行业新闻6 3.2重要公司公告7 3.3风险提示7 图表目录 图1:RunwayGen-2文生视频3 图2:W.A.L.T生成视频效果展示图4 图3:在UC和K600两个数据集上,W.A.L.T在指标上更优4 图4:与其它方法相比生成256×256分辨率图像上成本更低4 图5:本周计算机板块涨跌幅5 图6:申万计算机行业指数历史市盈率TTM6 表1:本周申万计算机行业前十大权重股票涨跌幅5 表2:本周计算机板块涨幅前十名5 1.每周一谈:从技术路线谈AI视频的未来发展 本周我们从技术路线来对近期爆火的AI视频进行展望。 自Pika爆火出圈后,越来越多的AI视频软件接踵而至,Pika的测评也出现了明显的口碑分化,市场主流观点认为视频生成领域也迎来了GPT时刻。 图1:RunwayGen-2文生视频 资料来源:Runway官网,申港证券研究所 从AI视频的技术迭代的路线看,我们认为: 从参与玩家的类型来看,整体是科技大厂居多,并没有出现如文生图模型一样的的现象,背后的原因在于文生视频的门槛较高。 从训练数据层来看,AI视频训练数据集的呈现跨模态的形式,以Runway的视频生成模型Gen-2为例,训练数据包括2.4亿张图片、640万个视频剪辑片段以及数亿个学习示例。 从形式来看,目前大多数模型厂商在文生视频上以闭源路线居多,其原因在于文生视频对算力及模型的工程化能力都很高。 文生视频模型背后其实有两条技术路线:一条是从文本或图像生成中得到广泛的应用,基于Transformer架构的技术路线,而另一条则是基于我们在之前的周报中有所提及的扩散模型,两条技术交替,目前扩散模型占据主流。 Google发布的Transformer架构已经在许多不同领域取得了较大的成功,但实际上包括最近的Pika在内,视频生成的主导范式依然是扩散模型。其原因在于Transformer中的注意力机制的内存需求会随输入序列长度而二次方增长,在处理视频这样的高维信号时,这样的增长模式会让计算成本成倍增加。 我们认为两种技术路线的融合可能会推动视频生成技术的发展,并对AI行业的争格局产生影响。斯坦福大学AI科学家李飞飞团队与谷歌合作,推出了视频生成模 型W.A.L.T,该模型成功地将Transformer架构整合到了隐视频扩散模型中,隐扩散模型(LDM)可在源自自动编码器的更低维隐空间中运行,从而降低计算需求。 图2:W.A.L.T生成视频效果展示图 资料来源:《PhotorealisticVideoGenerationwithDiffusionModels》,申港证券研究所 该方法由两阶段构成,并在公共基准上通过实验证明Transformer在隐视频扩散中具有卓越的生成质量和参数效率。 用一个自动编码器将视频和图像映射到一个统一的低维隐空间。这样一来,就可以在图像和视频数据集上联合训练单个生成模型,并显著降低生成高分辨率视频的计算成本。 重新设计了一种用于隐视频扩散模型的新Transformer块,其由自注意力层构成,这些自注意力层在非重叠、窗口限制的空间和时空注意力之间交替。该设计能显著降低计算需求,有效地处理图像、视频帧及视频的时间关系。 图3:在UC和K600两个数据集上,W.A.L.T在指标上更优图4:与其它方法相比生成256×256分辨率图像上成本更低 资料来源:《PhotorealisticVideoGenerationwithDiffusionModels》,申港证券 研究所 资料来源:《PhotorealisticVideoGenerationwithDiffusionModels》,申港证券 研究所 1.1投资策略 尽管通用大模型正以飞快的速度发展和迭代,但我们认为在文生视频领域距离GPT时刻的来临仍需一定的时间,预计明年二季度会出现下一个出圈的AI视频应用。 目前AI视频有两个较大的门槛,一是算力的掣肘,视频领域对算力需求更高;另 一方面是竞争环境的激烈,当前头部科技巨头基本都已入局,只是产品尚未全面公测。 从W.A.L.T模型的例子来看,我们不能忽视算法的演进对AI视频领域的影响,同时也需注意轻量化的视频制作产品最终面向的是非专业人群,这也意味着能否以差异化优势吸引用户也是成功的关键。 建议重点关注:视觉算法领先的虹软科技、当虹科技、格灵深瞳,大模型侧的科大讯飞,应用侧的金山办公、万兴科技、福昕软件等。 2.板块回顾 本周申万计算机指数跌幅较大,下跌1.48%,在申万一级行业中排名24/31。 图5:本周计算机板块涨跌幅 6.00% 4.00% 2.00% 0.00% -2.00% -4.00% -6.00% 综合传媒 纺织服饰 煤炭轻工制造房地产建筑材料商贸零售公用事业社会服务建筑装饰国防军工机械设备 环保 汽车家用电器 银行非银金融基础化工交通运输美容护理 电子农林牧渔计算机石油石化有色金属医药生物 钢铁通信 电力设备食品饮料 -8.00% 资料来源:iFind,申港证券研究所 本周申万计算机行业指数前十大权重股整体除德赛西威、海康威视、金山办公外均为下跌,其中大华股份、中科曙光、浪潮信息回调幅度较大。 表1:本周申万计算机行业前十大权重股票涨跌幅 序号 Wind代码 证券名称 上周末收盘价/元 本周末收盘价/元 涨跌幅 指数权重 主要业务 1 002415.SZ 海康威视 32.65 33.31 2.02% 5.88% 视频安防设备 2 002230.SZ 科大讯飞 48.45 48.34 -0.23% 4.13% AI(教育、平台2C、城市医疗) 3 688111.SH 金山办公 324.30 328.22 1.21% 3.01% SaaS(办公软件) 4 603019.SH 中科曙光 41.21 39.13 -5.05% 2.14% 高性能计算机硬件 5 600570.SH 恒生电子 29.46 28.77 -2.34% 2.07% 金融IT 6 000977.SZ 浪潮信息 36.08 34.82 -3.49% 1.68% 云计算 7 600588.SH 用友网络 17.94 17.81 -0.72% 1.56% SaaS(ERP) 8 002920.SZ 德赛西威 123.72 128.96 4.24% 1.55% 无人驾驶 9 002236.SZ 大华股份 19.85 18.71 -5.74% 1.51% 视频安防设备 10 300033.SZ 同花顺 159.30 157.30 -1.26% 1.40% 金融IT 资料来源:iFind,申港证券研究所 本周计算机板块涨幅前十大个股:苏州科达、云鼎科技、恒银科技、方直科技、丝路视觉、赛为智能、御银股份、维海德、软通动力及汉王科技。 表2:本周计算机板块涨幅前十名 排名 Wind代码 证券名称 上周末收盘价/元 本周末收盘价/元 涨跌幅 主要业务 1 603660.SH 苏州科达 8.03 10.83 34.9% 视频监控 2 000409.SZ 云鼎科技 8.19 10.28 25.5% 工业互联网 3 603106.SH 恒银科技 7.61 8.66 13.8% 计算机设备配件 4 300235.SZ 方直科技 11.79 13.31 12.9% 教育IT 5 300556.SZ 丝路视觉 24.88 28.07 12.8% 计算机视觉 6 300044.SZ 赛为智能 6.24 6.90 10.6% 无人机 7 002177.SZ 御银股份 3.97 4.34 9.3% 金融服务 8 301318.SZ 维海德 32.10 34.66 8.0% 摄像机 9 3