您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[平安证券]:行业点评:OpenAI发布文生视频大模型Sora,在全球视频大模型领域取得里程碑式进展 - 发现报告
当前位置:首页/行业研究/报告详情/

行业点评:OpenAI发布文生视频大模型Sora,在全球视频大模型领域取得里程碑式进展

信息技术2024-02-18闫磊、付强、黄韦涵平安证券赵***
AI智能总结
查看更多
行业点评:OpenAI发布文生视频大模型Sora,在全球视频大模型领域取得里程碑式进展

行业点评 计算机 2024年02月18日 OpenAI发布文生视频大模型Sora,在全球视频大模型领域取得里程碑式进展 行情走势图 强于大市(维持) 证券分析师 投资咨询资格编号 闫磊 S1060517070006 付强 YANLEI511@pingan.com.cn投资咨询资格编号S1060520070001 黄韦涵 FUQIANG021@pingan.com.cn投资咨询资格编号S1060523070003 HUANGWEIHAN235@pingan.com.cn 事项: 当地时间2月15日,OpenAI在官网正式发布Sora,根据OpenAI官网信息, Sora是一个人工智能模型,能够通过文本提示生成逼真且富有想象力的视频。 平安观点: Sora文生视频功能强大,能够通过文本提示生成长达1分钟的视频。根据OpenAI官网介绍,作为文生视频大模型,Sora可以在保持视觉质量和遵循用户的文本提示的情况下,生成长达1分钟的视频。在OpenAI的官网页面,OpenAI展示了通过以下文本提示词生成的1分钟视频:一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拿着黑色手提包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。Sora生成的这1分钟的视频体现了文本提示的精确主题和背景细节的复杂场景,准确展现了角色和视觉风格。以往的图像和视频的生成方法,通常会通过调整大小、裁剪或修剪等方法将视频调整为标准尺寸,比如分辨率为256X256的4秒视频。相比以往的视频生成方法,Sora的文生视频能力显然更加强大,Sora可以采样宽屏1920x1080视频、垂直1080x1920视频以及介于两者之间的所有视频,这使得Sora可以直接以原生宽高比为不同设备创建内容。另外,Sora目前能够生成的视频时长可长达1分钟,遥遥领先于以往的视频生成时长。 Sora呈现良好的多模态能力,不仅支持文本生成视频,还具备图像生成视频等能力。另外,Sora还有生成图像的能力。Sora是一个扩散模型,与OpenAI的GPT模型类似,Sora也是使用transformer的架构。OpenAI将视频和图像表示为称为补丁的较小数据单元的集合,每个补丁类似于GPT中的令牌。通过统一表示数据的方式,OpenAI可以在比以前更广泛的视觉数据上训练Sora,涵盖不同的持续时间、分辨率和纵横比。Sora建立在OpenAI过去对DALL·E和GPT模型的研究之上。因此,Sora能够在生成视频时更忠实地遵循用户的文本提示。Sora表现出良好的多模态能力,不仅支持文本生成视频,还能够根据提供的图片作为输入来生成视频。在OpenAI官网,OpenAI演示了根据DALL·E2和DALL·E3的图片生成的视频。Sora还能够扩展生成的视频,在时间上向前或向后扩展,并具有连接视频等视频编辑的能力。另外,Sora还有生成图像的能力,Sora可以生成不同尺寸大小的图像,分辨率最高可达2048X2048的水平。 行 业报 告 行 业 点评 证 券研究报 告 Sora在理解和模拟物理世界方面取得了积极进展。在OpenAI官网发布的信息中,OpenAI并不止于将Sora定位为一个文生视频的大模型,OpenA 计算机行业点评 I将Sora定位为模拟世界的视频生成模型。通过训练Sora,OpenAI正在教授人工智能理解和模拟运行中的物理世界,目标是训练模型帮助人类解决需要现实世界交互的问题。在模拟物理世界方面,Sora取得了积极的进展。在与现实世界互动方面,Sora有时能够以一些简单的方式模拟现实世界的状态。比如,画家可以在画布上留下新的笔画,并且这些笔画随着时间的推移会持续存在。再比如,视频中人可以吃汉堡并在汉堡上留下咬痕。另外,在模拟数字世界方面,在视频游戏中,Sora可以同时通过基本策略控制《我的世界》中的玩家,同时以高保真度渲染世界及其动态。这些能力可以通过用提及 《我的世界》的标题提示来让Sora实现。OpenAI称,Sora当前所拥有的能力表明,视频模型的持续扩展是开发物理和数字世界以及生活在其中的物体、动物和人的强大模拟器的一条有前途的道路。当然,Sora仍有很多局限性。比如,它不能准确地模拟许多基本相互作用的物理过程,例如玻璃破碎。其他交互(例如吃食物)并不总是会产生对象状态的正确变化。目前,Sora并未完全开放。在Sora可用之前,OpenAI将采取一些重要的安全措施。OpenAI正在与红队成员(错误信息、有害的内容和偏见等领域的领域专家)合作,这些红队成员将以对抗性的方式测试Sora模型的安全性。 投资建议:OpenAI发布文生视频大模型Sora,在全球视频大模型领域取得里程碑式进展。当前,全球范围内大模型领域的竞争依然白热化,这将持续拔升大模型的整体能力水平。大模型需要大算力,大模型算法的迭代升级将为全球和中国AI算力市场的增长提供强劲动力。在美国对华半导体出口管制升级的背景下,我国国产AI芯片产业链将加快成熟,相关AI芯片和服务器厂商将深度受益。另外,在应用端,我国国产大模型能力持续升级,AIGC产业未来发展前景广阔。在标的方面:1)算力方面,推荐浪潮信息、中科曙光、紫光股份、海光信息,建议关注工业富联、寒武纪、景嘉微;2)算法方面,推荐科大讯飞;2)应用场景方面,强烈推荐中科创达、恒生电子、盛视科技,推荐金山办公,建议关注万兴科技、同花顺、彩讯股份;4)网络安全方面,强烈推荐启明星辰。 风险提示:1)国内大模型算法发展可能不及预期。2)AI算力供应链风险上升。3)大模型产品的应用落地低于预期。 平安证券研究所投资评级: 股票投资评级: 强烈推荐(预计6个月内,股价表现强于市场表现20%以上)推荐(预计6个月内,股价表现强于市场表现10%至20%之间)中性(预计6个月内,股价表现相对市场表现在±10%之间)回避(预计6个月内,股价表现弱于市场表现10%以上) 行业投资评级: 强于大市(预计6个月内,行业指数表现强于市场表现5%以上)中性(预计6个月内,行业指数表现相对市场表现在±5%之间)弱于大市(预计6个月内,行业指数表现弱于市场表现5%以上) 公司声明及风险提示: 负责撰写此报告的分析师(一人或多人)就本研究报告确认:本人具有中国证券业协会授予的证券投资咨询执业资格。 平安证券股份有限公司具备证券投资咨询业务资格。本公司研究报告是针对与公司签署服务协议的签约客户的专属研究产品,为该类客户进行投资决策时提供辅助和参考,双方对权利与义务均有严格约定。本公司研究报告仅提供给上述特定客户,并不面向公众发布。未经书面授权刊载或者转发的,本公司将采取维权措施追究其侵权责任。 证券市场是一个风险无时不在的市场。您在进行证券交易时存在赢利的可能,也存在亏损的风险。请您务必对此有清醒的认识,认真考虑是否进行证券交易。 市场有风险,投资需谨慎。 免责条款: 此报告旨为发给平安证券股份有限公司(以下简称“平安证券”)的特定客户及其他专业人士。未经平安证券事先书面明文批准,不得更改或以任何方式传送、复印或派发此报告的材料、内容及其复印本予任何其他人。 此报告所载资料的来源及观点的出处皆被平安证券认为可靠,但平安证券不能担保其准确性或完整性,报告中的信息或所表达观点不构成所述证券买卖的出价或询价,报告内容仅供参考。平安证券不对因使用此报告的材料而引致的损失而负上任何责任,除非法律法规有明确规定。客户并不能仅依靠此报告而取代行使独立判断。 平安证券可发出其它与本报告所载资料不一致及有不同结论的报告。本报告及该等报告反映编写分析员的不同设想、见解及分析方法。报告所载资料、意见及推测仅反映分析员于发出此报告日期当日的判断,可随时更改。此报告所指的证券价格、价值及收入可跌可升。为免生疑问,此报告所载观点并不代表平安证券的立场。 平安证券在法律许可的情况下可能参与此报告所提及的发行商的投资银行业务或投资其发行的证券。平安证券股份有限公司2024版权所有。保留一切权利。 平安证券研究所电话:4008866338 深圳上海北京 深圳市福田区益田路5023号平安金融中心B座25层 上海市陆家嘴环路1333号平安金融大厦26楼 北京市丰台区金泽西路4号院1号楼丽泽平安金融中心B座25层