您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[德邦证券]:计算机:Openai发布文生视频模型Sora,AI视频商用不再遥远 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机:Openai发布文生视频模型Sora,AI视频商用不再遥远

信息技术2024-02-19钱劲宇德邦证券G***
AI智能总结
查看更多
计算机:Openai发布文生视频模型Sora,AI视频商用不再遥远

OpenAI发布首个文生视频模型Sora。Sora的工作原理类似DALL-E。用户输入想要的场景,Sora即可返回一个高清视频片段。此外,Sora还可根据静态图像拓展现有视频或填充缺失的帧。 相对于RunwayGen2、Pika等文生视频模型,Sora取得了重大突破。上限1分钟的视频长度,传统的文生视频工具支持的视频时长上限仅为十多秒,而Sora则支持最高1分钟的视频长度,并能够自定义分辨率和尺寸;单视频多角度运镜能力,人物和背景元素能够随着相机的移动而移动,一镜到底的同时维持主人物和背景的一致性。理解物理世界规律,Sora能够模拟现实世界中人类、动物和环境的某些特征,进而实现与世界互动或者模拟数字世界,这使得所生成的视频内容更具真实性。此外,Sora还支持多种视频合成技术,包括扩展视频、视频到视频编辑,以及无缝连接两个视频,并支持最高2K分辨率的图片生成,并能够根据图片和提示词生成视频。 算力支撑与大规模高质量数据训练仍为视频大模型基本盘。据OpenAI表示,Sora所展现的能力表明,继续扩大视频模型规模能够更有效的模拟物理和数字世界中的人类、动物和物体,随着视频模型时长、分辨率等各项参数的进一步提升,将对算力提出更高的要求。此外,Sora仍为基于Transformer架构的扩散模型,在此基础上,Sora与Gen-2等产品所形成的效果差异主要来自于大规模高质量的训练数据。目前公开的视频数据集,诸如Kinetics、HMDB51、Charades等,视频长度都比较短,一般只有几秒钟。根据AIGC开放社区分析,OpenAI已获得一批高质量的视频训练数据集,且在训练方法上实现重大创新。 Sora或已具备商用化技术基础,AI视频商用不再遥远。虽然目前Sora存在一定的局限性,诸如无法准确模拟常见的物理运动过程,视频互动中无法正确显示物体状态的变化、长时间样本发展的不连贯性或物体突然出现等等。但我们认为,Sora所呈现的效果,所支持的视频参数等基础条件已具备商用化技术基础,AI视频商用将不再遥远,有望在影视、广告、短视频等多个领域实现应用。 重点关注: (1)大模型及应用:科大讯飞、云从科技、万兴科技、虹软科技、焦点科技、当虹科技等。 (2)算力及服务器:海光信息、寒武纪、浪潮信息、中科曙光、神州数码、高新发展等。 风险提示:AI视频大模型迭代不及预期;AI视频市场接受度不及预期;高质量训练数据规模不及预期等。