自Sora之后,国内外视频生成大模型领域发展活跃。2024年上半年,视频生成大模型领域经历了快速的发展和迭代,特别是在6月份迎来了爆发期,技术、产品、融资领域均有较大进展。(1)技术上:新模型在生成时长、分辨率、帧率上快速提升,缩小了与Sora之间的差距。(2)产品上:许多新产品和模型升级面向全体用户开放,部分已应用于微短剧创作,大幅降低了成本和制作周期。国内公司在用户开放和商业落地方面进展迅速,展示了AI视频大模型应用的具体情境与商业可行性。 (3)融资上:在短短5个月内,至少有5家创业公司获得超亿元融资,累计约12亿元人民币。 AI视频生成技术的快速发展正在重塑视频制作行业,具有巨大的市场潜力。基于视频时长和AI渗透率的假设,我们测算得到,中国AI视频生成的潜在行业空间为947亿~5858亿元人民币,中性假设下(AI渗透率=15%)为3178亿元。我们认为AI渗透率提升的核心驱动力在于企业的降本增效诉求。我们测算了AI降本幅度。(1)传统模式下,2018年,2018年,电视剧、电视动画片平均投资成本为7519万元/部、686万元/部;电影的制作成本(不含宣发)为2300万元~1.7亿元/部。2024年5月微短剧制作成本约为50万元人民币(国内)、30万美元(海外)。 而全AI模式下,电影、长剧、动画片、短剧的制作成本分别为2.5/9.3/3.7/0.4万元人民币,相较于传统模式成本降低幅度超95%。(2)人机共创模式下,电影制作成本有望降低43%。我们认为AI渗透率提升将沿着三个方向:一是从短视频向长视频渗透,二是从奇幻和玄幻题材向全题材渗透,三是从部分环节向全流程渗透。增效方面,从可灵、清影、Pixverse等产品的迭代来看,AI视频生成技术正在快速迭代,可控性、一致性、物理世界理解能力均在提升。我们认为,AI视频生成大模型正在经历类似Midjourney V5迭代,从“玩具”升级为“生产力工具”。随着技术的迭代和应用的普及,预计AI视频生成大模型将迎来用户的大规模汇聚和数据飞轮的运转,推动产业进一步发展。 在当前的视频生成技术竞赛中,互联网大厂很可能将扮演引领者的角色。我们认为核心竞争要素在于数据、场景和用户。数据是训练高质量模型的关键,而场景决定了产品的市场适应性和商业潜力,互联网大厂在这三个维度均占优势。目前,移动互联网MAU增长放缓,而AIGC APP的MAU快速增长,24年6月渗透率提升至5%,并仍有提升空间。我们认为未来的流量分配格局将很大程度由AI主导,用户将天然地流向更好用、更有趣、更低门槛的内容消费平台。这解释了为什么字节、快手高度重视视频生成项目。字节将剪映定位为P0级项目,由原CEO张楠带队;快手则将“可灵”定位于战略级项目,由技术大牛万鹏飞带队,获得程一笑的支持,集全公司数据、算力和资金资源。另一方面,我们认为专业的全流程影视创作平台仍然具有较强的用户壁垒。我们分析了ADOBE过去一年半股价走势和公司经营策略,发现尽管23年初以来受到新的图像AI创作工具冲击,公司通过积极转型、将AI嵌入原有工作流程,推行正版训练数据,实现了ARPU提升和收入增长。 投资建议:我们建议从三条主线把握投资机会。一是在AI视频生成技术前瞻布局也具有商业化场景的公司,推荐快手、万兴科技、美图公司。 二是具备优质视频语料的公司。版权纠纷频发的背景下,大模型企业对于优质、正版、合规的数据需求将大提升。建议关注视觉中国、捷成股份、华策影视、中广天择。三是拥有大量影视IP的公司。文生视频模型有望加速其影视内容生产和IP开发、实现降本增效。同时,IP和视频语料也有望进一步成为视频模型训练的来源。推荐上海电影、光线传媒、博纳影业、中文在线。 风险提示:产品上线不及预期,技术发展不及预期,监管政策变化等。 表:重点公司估值 注1:预测数据来自东吴证券研究所。 注2:除PE外,所有数据的单位均为人民币,快手和美图公司的总市值和收盘价按照2024/8/7港元兑人民币0.9198汇率换算。 1.6月国内视频生成大模型爆发,可灵快速出圈 Sora之后,国内外至少8家公司发布新产品或模型升级,多数已向全体用户开放,技术、应用和融资方面取得积极进展。Stability AI宣告Stable Video开启公测,紧接着谷歌、阿里巴巴、字节等企业亦纷纷更新或公布其AI视频模型。 (1)技术方面,模型生成时长明显进步,基础生成时长延长,支持超10秒时长的产品增多,视觉效果方面分辨率、帧率提升,与Sora的差距大幅缩短。 (2)应用方面,已有较多产品面向C端开放,部分产品已应用于微短剧创作,成本和制作周期较传统模式大幅缩减。国内公司相较于Sora在面向用户开放以及商业落地方面先行迈进,使市场目睹了AI视频大模型应用的具体情境与商业可行性。 (3)融资方面,5个月内至少5家创企获得超亿元融资,累计约12亿元,Runway被曝正在洽谈4.5亿美元融资。除了传统互联网大厂,爱诗科技、生数科技、三呆科技(Sand AI)、Haiper AI等新玩家获得融资,部分公司创始人背景强大。Pika和HeyGen于6月分别获得8000万美元、6000万美元融资,投后估值均在5亿美元左右。 1.1.Sora以来,视频生成模型上线加速 今年2月16日,OpenAI推出Sora,引发了市场对AI视频生成赛道的广泛关注。然而,历经5个月,Sora仍未上线。在此期间,国内外的大型企业、创新企业纷纷竞相发布新产品或进行模型升级,并且多数已面向全体用户开放,其中存在诸多效果亮眼的产品,致使AI视频生成的格局再度产生变化。自Sora发布以来,国内外至少有10家公司发布了新产品或模型,7月24日快手可灵和爱诗科技pixverse v2.0同一天发布,7月26日智谱发布AI视频生成产品“清影”,7月30日生数科技发布VIDU模型,8月6日智谱清影宣布“清影”背后的模型CogVideoX-2B开源。 从技术能力上看,这些视频模型的基础生成时长由先前的2~4秒延长至5秒,且超过半数支持超10秒的时长,另有部分产品提供了延长功能。于当前免费可用的产品当中,生成视频时长最长的为可灵的3分钟。分辨率和帧率亦有提升,支持720P及以上的产品数量增多,帧率向24/30fps趋近;而此前的产品所生成视频的分辨率大多约为1024×576,帧率多为8~12fps。 Sora尚未推出,为国产大模型创造了良好的窗口期。我们认为国产视频大模型有较大追赶潜力。 表1:AI视频生成产品/模型升级情况(截至2024/8/6) 1.2.可灵大模型全球上线、pixverse升级,国产大模型应用落地领先 可灵大模型的发布标志着国内视频生成大模型已达到新的高度。6月6日发布当天,诸多业内人士受邀测试,整体反馈良好。可灵的表现相较抖音和腾讯过往推出的视频生成模型更为出色。(1)时长方面,可灵能够生成时长达3分钟的视频,然而抖音的即梦现阶段仅支持生成最长3秒的视频,腾讯的混元大模型则可生成16秒的视频。 (2)快手可灵与Sora相近,在技术路线、训练数据质量等方面突出,还能如Sora般真实还原物理规律,在运动合理性等方面表现优秀。猎豹移动董事长傅盛表示,可灵甚至能超越Sora。(3)技术维度上,“可灵”在多个技术维度上表现优秀,不仅可以支持生成长达2分钟、分辨率高达1080p的视频,且支持多种视频格式、多种宽高比;可以模拟物理世界特征,具备强大的概念组合能力和想象力,对细节刻画到位。(4)最重要的是,“可灵”不是实验室放出的Demo或者视频结果演示,而是短视频领域头部玩家快手推出的产品级应用。 可灵大模型C端热度较高,访问量及DAU快速增长,实现跨圈层的传播。可灵模型已嵌入快影APP中。快影类似于抖音的剪映,是一个面向创作者的视频编辑工具。 用户可以通过内测获得AI生成视频的功能。近一个月,快手快影APP在中国IOS排行榜的名次快速提升,7月3日已在“摄影与录像免费应用”榜单上排第6。截至7月9日,可灵AI已生成700万条视频,吸引了近70万申请用户,成为全网最热的视频生成大模型。在抖音、快手、小红书等社交媒体平台上出现了大量使用可灵制作的AI视频,如让专辑封面动起来或使老照片复活等,其热度正逐步增长,实现了跨圈层的传播。 图1:2024年4-7月快手快影APP在中国IOS排行榜排名 图2:快手可灵官网日度访问量(万次) 爱诗科技Pixverse7月24日全球同步发布了AI视频生成产品PixVerse V2版本。相较于V1,升级版引入了自研的时空注意力机制,增强了空间和时间感知能力,使得视频生成更长、更一致、更有趣。 相较于其他视频生成软件,pixverse的特点在于:1)可以自行创建角色(character),支持三种生成模式,即文本生成视频(text to video)、图片生成视频(image to video)和角色生成视频(character to video);2)支持微调,生成后可以修改视频中的特定元素,例如“去除天空中的云”、“动作修改为跑步”;3)有UGC社区,可以根据其他用户发布的内容“做同款”。 图3:Pixverse使用界面 Pixverse采用订阅收费模式,每次生成视频需消耗10~30积分,生成后对视频进行修改所消耗的积分和创建一个全新视频是一样的定价。基础版为免费,每天可获得50积分,即最多可以生成5次;付费版本包括标准版、pro版、premium三档,定价从5美元/月到60美元/月不等。据此计算,Pixverse V2模型定价约为0.1美元/8秒,0.05美元/5秒。 表2:Pixverse收费模式 表3:Pixverse会员权益 2.行业空间:基于视频时长测算,AI视频生成潜在行业空间为 3178亿元 2.1.中性假设下,C端和B端潜在行业空间分别为2673亿元、505亿元 我们将AI视频生成应用领域分为C端和B端,预计C端先行,B端逐步渗透。目前AI渗透率较低,我们基于视频上传和制作时长,以及AI渗透率的假设,对行业潜在规模进行测算。 根据广电总局报告,2023年全年中国互联网平台新增短视频5.5亿小时、2023年全年新增互联网视频节目(不含短视频)时长为1.1亿小时。我们认为,AI视频生成技术的普及有望推动从“拍摄视频”逐步转变为“拍摄+AI生成”并行模式。我们将AI视频生成渗透率定义为“AI生成的视频内容时长÷上传总时长”,并预计渗透率将逐步提升。 目前,可灵定价为1元/5秒(高性能模式)、3.5元/5秒(高表现模式),对应每小时生成价格为720~2520元。由于B端内容质量要求较高(例如更高的清晰度、更高的一致性要求、更多的生成次数),单位时间的AI制作成本较C端将更高。我们取720元/小时代表C端价格、2520元/小时代表B端价格。结果是,中国AI视频生成的行业潜在空间为947~5858亿元,中性假设下(AI渗透率=15%)为3178亿元,其中C端、B端市场空间分别为2673亿元、505亿元。 表4:AI视频技术在影视行业的潜在长期市场空间测算 在以上计算中,我们的假设主要有三个:总视频时长、AI视频生成模型定价、AI渗透率,其中AI渗透率是最核心的假设。 我们认为,AI渗透率提升的驱动力在于:1)AI成本低于人力,且在快速下降;2)AI的技术在快速进步,效果逐步达到甚至超越人力。 我们预计,AI渗透率将沿着三个方向提升:1)从短视频向长视频渗透,2)从奇幻和玄幻题材向全题材渗透,3)从部分环节向全环节渗透。 在本章的第二、第三节,我们对以上观点进行展开。 2.2.AI渗透率提升驱动力在于企业的降本增效诉求 2.2.1.降本:AI可降低影视制作成本约43%(人机共创模式)、95%以上(全AI模式) 传统模式下,影视行业拍摄制作成本高昂,导致产能受限、存货周转率低、前期投入风险高昂。AI的引入有望大幅降低成本、提升影视内容产、提高存货周转率,并让影视投资风险更加可控。 2018年,电