您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华创证券]:快手可灵:国产首发对标Sora的DiT架构文生视频AI模型 - 发现报告
当前位置:首页/行业研究/报告详情/

快手可灵:国产首发对标Sora的DiT架构文生视频AI模型

文化传媒2024-06-07刘欣华创证券y***
AI智能总结
查看更多
快手可灵:国产首发对标Sora的DiT架构文生视频AI模型

行业研究 证券研究报告 传媒2024年06月07日 AI产品测评体验系列报告 快手可灵:国产首发对标Sora的DiT架构文生视频AI模型 推荐(维持) 华创证券研究所 证券分析师:刘欣 邮箱:liuxin3@hcyjs.com 2023-06-07~2024-06-06 6% -9% 23/06 -25% 23/08 23/1024/0124/0324/06 -41% 传媒 沪深300 相关研究报告 《AI产品测评体验系列报告:PixVerse:国内AI 视频生成工具先锋》 2024-06-05 《传媒行业周观察(20240527-20240531):腾讯推出AI助手App“元宝”,传媒关注AI与估值修复机会,港股继续看好边际向好个股》 2024-06-02 《传媒行业重大事项点评:腾讯正式发布AI助手 APP「元宝」,看好AI产业应用侧景气度提升》 2024-06-01 快手可灵是快手于2024年6月6日推出的一款AI视频生成大模型的AI视频。可灵为快手AI团队自研,基于快手在视频技术方面的多年积累,采用类似Sora的DiT技术路线,结合多项自研技术创新,效果对标Sora。  从技术角度看,快手可灵结合多项自研技术创新,采用了原生的文生视频技术路线,替代了图像生成+时序模块的组合,实现了可灵生成时间长、帧率高,能准确处理复杂运动的能力。在完成度上,能够模拟物理世界特性,完成大幅度的合理运动;在创新度上,具备强大的概念组合能力和想象力,能够将用户 电话:010-63214660执业编号:S0360521010001  丰富的想象力转化为具体的画面;在参数表现上,不仅支持生成长达2分钟的30fps且具备1080p分辨率的超长视频,同时支持多种宽高比。从功能体验看,快手可灵大模型具备强大的视频生成能力让用户可以轻松高 行业基本数据 股票家数(只) 142 占比%0.02 效地完成艺术视频创作,通过文字描述,可灵生成的视频可实现1)大幅度的 总市值(亿元) 12,270.01 1.41 合理运动:可灵采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律,复杂、大幅度的时空 流通市值(亿元) 10,952.73 1.61 运动也能准确刻画;2)长达2分钟的视频生成:得益于高效的训练基础设施、 相对指数表现 % 1M 6M 12M 绝对表现 -13.5% -25.7% -35.8% 相对表现 -11.7% -31.4% -30.1% 极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频,且帧率达到30fps;3)模拟物理世界特性:基于自研模型架构及ScalingLaw激发出的强大建模能力,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频;4)强大的概念组合能力:基于对文本-视频语义的深刻理解和DiffusionTransformer架构的强大能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实的世界;5)电影级的画面生成:基于自研3DVAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景,还是细腻入微的特写镜头,都能够生动呈现;6)支持自由的输出视频宽高比:可灵采用了可变分辨率的训练策略,在推理过程中可以做到同样的内容输出多种多 样的视频宽高比,满足更丰富场景中的视频素材使用需要。 从行业视角看,快手作为头部短视频公司积极布局AI,其产品表现不仅展现了快手在AI大模型技术方面的深厚积累,也体现了国产AI视频模型的技术能力。我们看好AI技术持续迭代,中国厂商技术加速追赶,看好AI视频应用加速发展与商业化探索,看好内容创作的门槛降低。 风险提示:政策监管趋严,AI技术迭代发展不及预期,AI产品商业化不及预期。 目录 一、产品简介4 二、功能体验4 (一)大幅度的合理运动4 (二)长达2分钟的视频生成4 (三)模拟物理世界特性5 (四)强大的概念组合能力6 (🖂)电影级的画面生成6 (六)支持自由的输出视频宽高比7 三、风险提示7 图表目录 图表1宇航员在月球上奔跑的画面,动作流畅,步态和影子的运动合理恰当4 图表2仅依靠提示词“小男孩在花园里骑自行车经历秋冬春夏四季变换”,即可生成长达 一分半的长视频5 图表3小男孩吃汉堡的生成视频中,吃汉堡的过程被真实反映,咬合位置与汉堡上的咬 痕匹配,脸部肌肉动态逼真5 图表4对于猫咪开着车的充满想象力的场景,逼真展现6 图表5生成视频分辨率高达1080p6 图表6同一个视频支持自由的高宽比,其中包括快手原生态的竖版视频7 一、产品简介 快手可灵是快手于2024年6月6日推出的一款AI视频生成大模型的AI视频。可灵为快手AI团队自研,基于快手在视频技术方面的多年积累,采用类似Sora的DiT技术路线,结合多项自研技术创新,效果对标Sora,具有一系列优势:1)能够生成大幅度的合理运动;2)能够模拟物理世界特性;3)具备强大的概念组合能力和想象力;4)生成的视频分辨率高达1080p,时长高达2分钟(帧率30fps),且支持自由的宽高比。(部分功能效果尚未对外开启使用测试) 二、功能体验 根据可灵官网,可灵大模型具备强大的视频生成能力让用户可以轻松高效地完成艺术视频创作,通过文字描述,可灵生成的视频可实现: (一)大幅度的合理运动 可灵采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律,复杂、大幅度的时空运动也能准确刻画。 图表1宇航员在月球上奔跑的画面,动作流畅,步态和影子的运动合理恰当 资料来源:快手可灵官网 (二)长达2分钟的视频生成 得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频,且帧率达到30fps。 图表2仅依靠提示词“小男孩在花园里骑自行车经历秋冬春夏四季变换”,即可生成长达一分半的长视频 资料来源:快手可灵官网 (三)模拟物理世界特性 基于自研模型架构及ScalingLaw激发出的强大建模能力,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。 图表3小男孩吃汉堡的生成视频中,吃汉堡的过程被真实反映,咬合位置与汉堡上的咬痕匹配,脸部肌肉动态逼真 资料来源:快手可灵官网 (四)强大的概念组合能力 基于对文本-视频语义的深刻理解和DiffusionTransformer架构的强大能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实的世界。 图表4对于猫咪开着车的充满想象力的场景,逼真展现 资料来源:快手可灵官网 (🖂)电影级的画面生成 基于自研3DVAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景,还是细腻入微的特写镜头,都能够生动呈现。 图表5生成视频分辨率高达1080p 资料来源:快手可灵官网 (六)支持自由的输出视频宽高比 可灵采用了可变分辨率的训练策略,在推理过程中可以做到同样的内容输出多种多样的视频宽高比,满足更丰富场景中的视频素材使用需要。 图表6同一个视频支持自由的高宽比,其中包括快手原生态的竖版视频 资料来源:快手可灵官网 三、风险提示 1、政策监管趋严; 2、AI技术迭代发展不及预期; 3、AI产品商业化不及预期; 传媒组团队介绍 组长、首席研究员:刘欣 中国人民大学硕士。先后于中金公司(2015-2016)、海通证券(2016-2019)、民生证券(2019-2020),从事TMT行业研究工作。所在团队2016/2017年连续两年获得新财富最佳分析师评选文化传媒类第三名,2016年水晶球评选第三名,2016年金牛奖第三名,2017年水晶球第�名,2017证券时报金翼奖第一名,2019年获得WIND第七届金牌分析师评选传播与文化类第�名等。 联席首席研究员:廖志国 莫纳什大学硕士。2021年加入华创研究所。助理研究员:吴婧 上海交通大学硕士,2023年加入华创证券研究所。 研究员:郭子萱 哥伦比亚大学硕士。曾任职于瑞银证券,2023年加入华创证券研究所。分析师:刘文轩 威斯康星大学麦迪逊分校硕士,2024年加入华创研究所,曾任职于德邦研究所。2023年所在团队获得21世纪金牌分 析师传媒互联网第�名,港股及海外市场第�名。研究员:赵海楠 复旦大学硕士。曾任职于浙商证券研究所,2023年所在团队获得Wind第11届金牌分析师传媒第二名。2024年加入 华创证券研究所。 华创证券机构销售通讯录 地区 姓名 职务 办公电话 企业邮箱 北京机构销售部 张昱洁 副总经理、北京机构销售总监 010-63214682 zhangyujie@hcyjs.com 张菲菲 北京机构副总监 010-63214682 zhangfeifei@hcyjs.com 刘懿 副总监 010-63214682 liuyi@hcyjs.com 侯春钰 资深销售经理 010-63214682 houchunyu@hcyjs.com 过云龙 高级销售经理 010-63214682 guoyunlong@hcyjs.com 蔡依林 资深销售经理 010-66500808 caiyilin@hcyjs.com 刘颖 资深销售经理 010-66500821 liuying5@hcyjs.com 顾翎蓝 资深销售经理 010-63214682 gulinglan@hcyjs.com 车一哲 销售经理 cheyizhe@hcyjs.com 深圳机构销售部 张娟 副总经理、深圳机构销售总监 0755-82828570 zhangjuan@hcyjs.com 汪丽燕 高级销售经理 0755-83715428 wangliyan@hcyjs.com 张嘉慧 高级销售经理 0755-82756804 zhangjiahui1@hcyjs.com �春丽 高级销售经理 0755-82871425 wangchunli@hcyjs.com 上海机构销售部 许彩霞 总经理助理、上海机构销售总监 021-20572536 xucaixia@hcyjs.com 官逸超 上海机构销售副总监 021-20572555 guanyichao@hcyjs.com 黄畅 上海机构销售副总监 021-20572257-2552 huangchang@hcyjs.com 吴俊 资深销售经理 021-20572506 wujun1@hcyjs.com 张佳妮 资深销售经理 021-20572585 zhangjiani@hcyjs.com 蒋瑜 高级销售经理 021-20572509 jiangyu@hcyjs.com 施嘉玮 高级销售经理 021-20572548 shijiawei@hcyjs.com 朱涨雨 高级销售经理 021-20572573 zhuzhangyu@hcyjs.com 李凯月 高级销售经理 likaiyue@hcyjs.com 易星 销售经理 yixing@hcyjs.com 张玉恒 销售经理 zhangyuheng@hcyjs.com 广州机构销售部 段佳音 广州机构销售总监 0755-82756805 duanjiayin@hcyjs.com 周玮 销售经理 zhouwei@hcyjs.com �世韬 销售经理 wangshitao1@hcyjs.com 私募销售组 潘亚琪 总监 021-20572559 panyaqi@hcyjs.com 汪子阳 副总监 021-20572559 wangziyang@hcyjs.com 江赛专 副总监 0755-82756805 jiangsaizhuan@hcyjs.com 汪戈 高级销售经理 021-20572559 wangge@hcyjs.com 宋丹玙 销售经理 021-25072549 songdanyu@hcyjs.com 华创行业公司投资评级体系 基准指数说明: A股市场基准为沪深300指数,香港市场基准为恒生指数,美国市场基准为标