您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国银河]:传媒互联网行业行业动态点评:文生视频模型Sora面世,AI生视频技术持续革新 - 发现报告
当前位置:首页/行业研究/报告详情/

传媒互联网行业行业动态点评:文生视频模型Sora面世,AI生视频技术持续革新

文化传媒2024-02-19岳铮、祁天睿中国银河曾***
传媒互联网行业行业动态点评:文生视频模型Sora面世,AI生视频技术持续革新

文生视频模型Sora面世,AI生视频技术持续革新 --行业动态点评 核心观点: 事件:北京时间2月16日凌晨,OpenAI发布了其首个文生视频模型Sora。相比其他文生视频模型,Sora在整体性能,尤其是最大生成时长上有了较大幅度提升。 文生视频技术突破,视频时长和视频质量显著提升:Sora目前主要的功能包括文生视频、图生视频和视频生视频。1)文生视频:Sora目前可以根据文本要求生成60s的连贯视频,生成的视频除满足了文本要求的主题、要素外,在对场景内的光影、人物轮廓描绘等方面都展示了极高的质量:场景中的积水倒影处理真实,人物的特写镜头中脸部轮廓也非常清晰且细节丰富。同时,生成的视频在3D一致性、长期一致性、互动性上都表现出了较高的质量,并且支持多种分辨率输入和输出。2)图生视频:Sora能够在提供图像和文字提示作为输入的情况下生成视频。增加的图片提示将大幅缩窄模型的生成范围,可以帮助用户更快、更便捷地生成满足要求的视频。3)视频生视频:Sora可以根据输入的视频片段和文字要求对视频进行编辑,如更改背景等;Sora还能够在时间上向前或向后扩展视频:通过这种方法来向前和向后扩展视频,可以产生无缝的无限循环。视频扩展的功能可以在已有的素材基础上为创作者提供灵感,将为影视类素材的供给提供新的可能。 瑕不掩瑜,AI视频应用或加速推进:对比之前的AI视频模型,除最大生成时长从2-4s显著提升至60s外,Sora也对以往AI视频工具的不足和痛点进行了改进,尽管目前在一些物理过程和视频内人和物的交互上还不够稳定,但生成的视频质量总体来说已经有明显提升。我们认为,当前Sora生成的视频在长度和质量上已经具备了一定的生产力价值,AI生成视频在影视、游戏等相关行业内的应用或将加速推进。 文生视频工具应用前景广阔,相关行业供给有望开启新时代:随着AI文生视频技术的不断完善和更新,我们认为AI视频有望凭借人工智能的技术优势和视频这一品类的内容优势打开市场:在C端,通过AI视频生成,此类AI视频应用有望通过其生成的内容来构建自有用户流量池,完成后续的流量变现;在B端,AI视频可以大幅度降低视频的制作成本,对广告营销、影视、游戏等都有可观的降本增效作用,随着AI视频工具的不断更新迭代,相关产业制作效率或将实现质的提升,游戏、短视频等相关内容的供给端有望实现飞跃式的发展。 投资建议:短期来看,受AI技术及海外催化影响,建议关注海外映射AI产业链的投资机会。经前期调整后,目前板块具有较高的安全边际。中长期来看,随着AI视频生成技术的不断更新迭代,AI文生视频技术潜在的应用行业或将受益。建议关注:1)影视/IP类行业:光线传媒(300251.SZ)、华策影视 (300133.SZ)、上海电影(601595.SH)、中文在线(300364.SZ)等;2)游戏行业:恺英网络(002517.SZ)、三七互娱(002555.SZ)等。 风险提示:文生视频技术发展不及预期的风险、政策监管变化的风险、行业竞争的风险、相关技术应用不及预期的风险。 传媒互联网行业 推荐维持评级 分析师 岳铮 :010-8092-7630 :yuezheng_yj@chinastock.com.cn分析师登记编码:S0130522030006 研究助理祁天睿 :010-8092-7603 :qitianrui_yj@chinastock.com.cn 相对沪深300表现图 资料来源:Wind,中国银河证券研究院 相关研究 【银河传媒互联网】11月行业月报_文生视频领域产品Pika获关注,AI应用落地加速 【银河传媒互联网】行业动态点评_大模型训练数据付费或成趋势,关注出版板块估值修复机会 行业点评报告●传媒互联网行业 2024年2月19日 www.chinastock.com.cn证券研究报告请务必阅读正文最后的中国银河证券股份有限公司免责声明 目录 一、OpenAI发布Sora,支持高质量文生视频等多种功能3 (一)文生视频:质量高,单次生成时长飞跃式进展3 (二)图生视频:高效、精确地生成满足要求的视频4 (三)视频生视频:视频编辑与视频扩展5 二、Sora及之前部分可比产品对比6 三、投资建议7 四、风险提示7 一、OpenAI发布Sora,支持高质量文生视频等多种功能 (一)文生视频:质量高,单次生成时长飞跃式进展 北京时间2月16日凌晨,OpenAI发布了其首个文生视频模型Sora,其中,Sora展示了其生成的60s时长、主题为“衣着时髦的女人漫步在满是暖色霓虹灯和城市地标的东京街头”视频。除满足了文本要求的主题、要素外,Sora在对场景的光影、人物轮廓的描绘等方面都展示了极高的质量:场景中的积水倒影处理真实,人物的特写镜头中脸部轮廓也非常清晰且细节丰富。我们认为Sora生成的高质量视频在时长上实现了飞跃式的提升,60s的时长已经能够进入一些应用场景,如短视频、宣传片等,AI生成视频在相关行业内的应用或将加速推进。 图1:Sora生成的高质量演示视频图2:Sora演示视频中人物面部特写 资料来源:OpenAI,中国银河证券研究院资料来源:OpenAI,中国银河证券研究院 Sora模型文生视频功能主要亮点如下: 1.灵活采样,全分辨率输出:Sora对不同分辨率的内容使用同一模型,它可以采样从横屏、分辨率为1920x1080到竖屏、分辨率为1080x1920之间的所有分辨率的视频。这让Sora可以直接以不同设备的原始宽高比为其创建内容。Sora还可以在生成全分辨率的内容之前,以较小的尺寸快速创建内容原型的初稿,这有助于用户快速浏览生成视频的效果并及时进行修正。 图3:Sora可以输出各种分辨率的视频 资料来源:OpenAI,中国银河证券研究院 2.3D一致性:Sora可以生成带有动态摄像机运动的视频。随着摄像机的移动和旋转,人物和场景元素在三维空间中始终如一地移动,具有较好的3D一致性。 图4:Sora输出的视频3D一致性较好 资料来源:OpenAI,中国银河证券研究院 3.长期一致性和物体持久性:AI视频生成面临的一个重大挑战是在较长的视频中保持人或物的一致。Sora在大多数情况下能够有效地处理这些问题:例如,Sora可以保存人物、动物和物体,即使其被遮挡或暂时离开了镜头。Sora也可以在单个视频中生成同一角色的多个镜头,并在整个视频中保持其外观的一致。 图5:Sora的视频中人或物能够在较长的视频中保持稳定和一致 资料来源:OpenAI,中国银河证券研究院 4.互动性:Sora可以用简单的方式模拟影响世界状态的行为。例如,画家可以在画布上留下新的笔触,或者可以在一个人吃汉堡时留下正确的咬痕。 图6:Sora的视频中人物可以与世界产生实时交互 资料来源:OpenAI,中国银河证券研究院 (二)图生视频:高效、精确地生成满足要求的视频 Sora能够在提供图像和提示作为输入的情况下生成视频。我们认为,增加图片提示将大幅缩窄AI 工具的生成范围,可以帮助用户更快、更便捷地生成满足要求的视频。 图7:Sora支持在生成视频过程中加入图片提示 资料来源:OpenAI,中国银河证券研究院 (三)视频生视频:视频编辑与视频扩展 1.视频编辑 Diffusion模型使用了多种方法来编辑文本提示的图像和视频,Sora可以根据输入的视频片段和文字要求对视频进行编辑,如更改背景等。 图8:Sora的视频更改背景功能 资料来源:OpenAI,中国银河证券研究院 2.视频扩展 Sora还能够在时间上向前或向后扩展视频。通过这种方法来向前和向后扩展视频,可以产生无缝的无限循环。我们认为,视频扩展的功能可以在已有的素材基础上为创作者提供灵感,将为影视类素材的供给提供新的可能。 图9:Sora的视频扩展功能(三个视频不同展开最终得到相同结尾) 资料来源:OpenAI,中国银河证券研究院 二、Sora及之前部分可比产品对比 表1:Sora及之前部分可比产品对比 公司 OpenAI PikaLabs Runway StabilityAI 产品 Sora Pika1.0 Gen-2 StableVideoDiffusion模型 (SVD) 定位 AI视频生成工具 AI视频生成工具 AI视频生成工具 AI视频生成工具 竞争优势 1.在生成视频的时长上出现了飞跃式的进步,从原有的单次2-4s左右提升至最大60s,使AI生成视频真 正具有了一定的生产力价值。 2.针对之前AI视频工具的不足和痛点进行了改进,生成的视频质量总体来说更高。 1.生成的视频在时长、逻辑连贯性、流畅性、画质和风格准确性上有明显优 势。 2.PikaLabs1.0能够支持对于视频实时编辑和修改。 相比于传统的文本控制扩散模型,Gen通过文本、图像、视频混合的训练模 式,提高了生成视频的质 量和一致性,同时还降低了训练消耗。 同时,Runway还提出了延时扩散模型,在预训练的扩散模型中引入时序层, 使得模型在推理阶段具有更高的时间一致性。 在用户偏好研究中,StableVideoDiffusion在稳定性和性能上超过了商业竞争对手RunwayML和Pika Labs。该模型以图像到视频的形式发布,提供14或 25帧,可在3到30帧每秒之间调整帧率,并基于StableDiffusion图像模型。但Pika1.0版本的发布或 改变这一状况。 产品局限性 一些物理过程仍不能完美模拟(如玻璃破碎);有时不能准确模拟出视频中人和物的交互;较长时间的视频中“穿帮”镜头也偶 有出现。 少数视频可能缺少真实感。 对复杂语句的理解可能出现偏差。 StableVideoDiffusion对生成视频长度有限制;存在光影不对、而且整体不连贯(视频帧与帧之间闪烁)等问题。 当前唯一收费的文生视频 StabilityAI表示SVD目前 创始人郭文景表示,未来 应用是RunwayGen-2,商 仅限于研究,不适用于实 运营模式及后续发展 Sora目前仅向创作者部分 开放。 会考虑分层订阅模式,即用户支付更多费用可获得 业模式与图片生成趋同, 即主要按照生成量定价。 际或商业应用。SVD目前 也不是所有人都可以使 更多功能。 采用免费增值业务模式和 用,但已开放用户候补名 付费层级相结合。 单注册。 资料来源:OpenAI,Pika,澎湃新闻,中国银河证券研究院 图10:Sora对玻璃破碎等一些物理过程仍不能完美模拟 资料来源:OpenAI,中国银河证券研究院 三、投资建议 随着AI文生视频技术的不断完善和更新,我们认为AI视频有望凭借人工智能的技术优势和视频这一品类的内容优势打开市场:在C端,通过AI视频生成,此类AI视频应用有望通过其生成的内容来构建自有用户流量池,完成后续的流量变现;在B端,AI视频可以大幅度降低视频的制作成本,对广告营销、影视、游戏等都有可观的降本增效作用。我们认为,当前Sora生成的视频在长度和质量上已经具备了一定的生产力价值,随着AI视频工具的不断更新迭代,相关产业制作效率或将实现质的提升,游戏、短视频等相关内容的供给端有望实现飞跃式的发展。 短期来看,受AI技术及海外催化影响,建议关注海外映射AI产业链的投资机会。经前期调整后,目前板块具有较高的安全边际。中长期来看,随着AI视频生成技术的不断更新迭代,AI文生视频技术潜在的应用行业或将受益。建议关注:1)影视/IP类行业:光线传媒(300251.SZ)、华策影视(300133.SZ)、上海电影(601595.SH)、中文在线(300364.SZ)等;2)游戏行业:恺英网络(002517.SZ)、三七互娱 (002555.SZ)等。 四、风险提示 文生视频技术发展不及预期的风险、政策监管变化的风险、行业竞争的风险、相关技术应用不及预期的风险。 图表目录 图1:Sora生成的高质量演示视频3 图2:Sora演示视频中人物面部特写3 图3:Sora可以输出各种分辨率的视频3