您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[平安证券]:OpenAI发布文生视频大模型Sora,谷歌发布Gemini1.5 - 发现报告
当前位置:首页/行业研究/报告详情/

OpenAI发布文生视频大模型Sora,谷歌发布Gemini1.5

信息技术2024-02-19闫磊、付强、黄韦涵平安证券华***
AI智能总结
查看更多
OpenAI发布文生视频大模型Sora,谷歌发布Gemini1.5

证券研究报告 OpenAI发布文生视频大模型Sora, 谷歌发布Gemini1.5 计算机行业强于大市(维持) 平安证券研究所计算机团队 分析师:闫磊S1060517070006(证券投资咨询)YANLEI511@pingan.com.cn付强S1060520070001(证券投资咨询)邮箱:FUQIANG021@pingan.com.cn黄韦涵S1060523070003(证券投资咨询)HUANGWEIHAN235@pingan.com.cn 2024年2月19日 请务必阅读正文后免责条款 行业要闻及简评:1)OpenAI发布文生视频大模型Sora,在全球视频大模型领域取得里程碑式进展。当地时间2月15日,OpenAI在官网正式发布Sora,根据OpenAI官网信息,Sora是一个人工智能模型,能够通过文本提示生成逼真且富有想象力的视频。Sora文生视频功能强大,能够通过文本提示生成长达1分钟的视频。同时,Sora呈现良好的多模态能力,不仅支持文本生成视频,还 具备图像生成视频等能力,另外还有生成图像的能力。此外,Sora在理解和模拟物理世界方面取得了积极进展。2)谷歌发布Gemini1.5,一次性可处理的tokens显著提高。当地时间2月15日,谷歌发布Gemini1.5。Gemini1.5版本中首个登场的多模态 通用模型Gemini1.5Pro,把稳定处理上下文的上限扩大至100万tokens,实现迄今通用大模型最长的上下文窗口。大容量的tokens可以说是Gemini1.5版本的最大亮点。 重点公司公告:1)宇信科技发布回购报告书和关于首次回购公司股份的公告。2)海光信息发布关于提议回购股份暨公司“提质增效重回报”行动方案的公告。3)麒麟信安发布关于以集中竞价交易方式首次回购公司股份的公告。4)金山办公发布关于以集中竞价交易方式回购公司股份的回购报告书。5)润和软件发布关于以集中竞价交易方式回购公司股份方案的公告。 一周行情回顾:2024年2月5日-2月8日,计算机行业指数上涨5.81%,沪深300指数上涨5.83%,前者跑输后者0.02pct。截至2月8日,计算机行业市盈率为37.3倍。2月5日-2月8日,计算机行业354只A股成分股中,166只股价上涨,188只下跌。 投资建议:OpenAI发布文生视频大模型Sora,在全球视频大模型领域取得里程碑式进展。谷歌发布Gemini1.5,将上下文窗口长度扩展到100万个tokens,实现迄今通用大模型最长的上下文窗口。当前,全球范围内大模型领域的竞争依然白热化,这将持续拔升大模型的整体能力水平。大模型需要大算力,大模型算法的迭代升级将为全球和中国AI算力市场的增长提供强劲动力。在美 国对华半导体出口管制升级的背景下,我国国产AI芯片产业链将加快成熟,相关AI芯片和服务器厂商将深度受益。另外,在应用端,我国国产大模型能力持续升级,AIGC产业未来发展前景广阔。在标的方面:1)算力方面,推荐浪潮信息、中科曙光、紫光股份、海光信息,建议关注工业富联、寒武纪、景嘉微;2)算法方面,推荐科大讯飞;3)应用场景方面,强烈推荐中科创达、恒生电子、盛视科技,推荐金山办公,建议关注万兴科技、同花顺、彩讯股份;4)网络安全方面,强烈推荐启明星辰。 风险提示:1)供应链风险上升。2)政策支持力度不及预期。3)国产替代不及预期。 OpenAI发布文生视频大模型Sora,在全球视频大模型领域取得里程碑式进展 事件描述:当地时间2月15日,OpenAI在官网正式发布Sora,根据OpenAI官网信息,Sora是一个人工智能模型,能够通过文本提示生成逼真且富有想象力的视频。 点评:Sora文生视频功能强大,能够通过文本提示生成长达1分钟的视频。根据OpenAI官网介绍,作为文生视频大模型,Sora可以在保持视觉质量和遵循用户的文本提示的情况下,生成长达1分钟的视频。Sora生成的这1分钟的视频体现了文本提示的精确主题和背景细节的复杂场景,准确展现了角色和视觉风格。以往的图像和视频的生成方法,通常会通过调整大小、裁剪或修剪等方法将视频调整为标准尺 寸,比如分辨率为256X256的4秒视频。相比以往的视频生成方法,Sora的文生视频能力显然更加强大,Sora可以采样宽屏1920x1080视频、垂直1080x1920视频以及介于两者之间的所有视频,这使得Sora可以直接以原生宽高比为不同设备创建内容。另外,Sora目前能够生成的视频时长可长达1分钟,遥遥领先于以往的视频生成时长。 Sora呈现良好的多模态能力。Sora是一个扩散模型,与OpenAI的GPT模型类似,Sora也是使用transformer的架构。OpenAI将视频和图像表示为称为补丁的较小数据单元的集合,每个补丁类似于GPT中的令牌。通过统一表示数据的方式,OpenAI可以在比以前更广泛的视觉数据上训练Sora,涵盖不同的持续时间、分辨率和纵横比。Sora建立在OpenAI过去对DALL·E和GPT模型的研究之上。因此,Sora能够在生成视频时更忠实地遵循用户的文本提示。Sora表现出良好的多模态能力,1)Sora不仅支持文本生成视频,还能够根据提供的图片作为输入来生成视频。在OpenAI官网,OpenAI演示了根据DALL·E2和DALL·E3的图片生成的视频。2)Sora还能够扩展生成的视频,在时间上向 前或向后扩展,并具有连接视频等视频编辑的能力。3)另外,Sora还有生成图像的能力,Sora可以生成不同尺寸大小的图像,分辨率最高可达2048X2048的水平。 Sora在理解和模拟物理世界方面取得了积极进展。OpenAI将Sora定位为模拟世界的视频生成模型。在与现实世界互动方面,Sora有时能够以一些简单的方式模拟现实世界的状态。比如,画家可以在画布上留下新的笔画,并且这些笔画随着时间的推移会持续存在。再比如,视频中人可以吃汉堡并在汉堡上留下咬痕。另外,在模拟数字世界方面,在视频游戏中,Sora可以同时通过基本策略控制《我的世界》中的玩家,同时以高保真度渲染世界及其动态。 3 资料来源:OpenAI官网,平安证券研究所 谷歌发布Gemini1.5,一次性可处理的tokens显著提高 事件描述:当地时间2月15日,谷歌发布Gemini1.5,将上下文窗口长度扩展到100万个tokens。 点评:Gemini1.5一次性可处理的tokens显著提高。Gemini1.5版本中首个登场的多模态通用模型Gemini1.5Pro,把稳定处理上下文的上限扩大至100万tokens,实现迄今通用大模型最长的上下文窗口。这意味着Gemini1.5Pro可一次处理大量的信息——包括1小时的 视频、11小时的音频、超过3万行代码或超过70万字的文本。通过一系列机器学习创新,谷歌将上下文窗口容量大大增加,从Gemini1.0Pro的3.2万个tokens,增加到1.5Pro的100万个tokens。目前谷歌开放给开发者的测试版本中,Gemini1.5Pro带有标准的12.8万个tokens的上下文窗口。从发布日起,有限的开发人员和企业客户可通过AIStudio和VertexAI在私有预览中试用多达100万个tokens的上下文窗口。谷歌正在积极地进行优化,以改善延迟,减少计算需求并增强用户体验。相比Gemini1.0Pro的3.2万tokens、GPT-4Turbo的12.8万tokens、Claude2.1的20万tokens,Gemini1.5Pro一次性可处理的tokens显著提高,大容量的tokens可以说是Gemini1.5版本的最大亮点。谷歌CEO皮查伊透露,谷歌的研究人员已经成功测试过1000万tokens的上下文窗口。 Gemini1.5Pro的多模态能力明显强于Gemini1.0Pro,甚至可以对标Gemini1.0Ultra。在性能表现方面,在87.1%(27/31 benchmarks)的基准测试中,Gemini1.5Pro的核心能力优于Gemini1.0Pro;在54.8%(17/31benchmarks)的基准测试中,Gemini1.5 Pro的核心能力优于Gemini1.0Ultra。在对文本、视觉、音频分项测试时,在文本方面,在100%(13/13benchmarks)的基准测试中,Gemini1.5Pro的核心能力均优于Gemini1.0Pro,在77%(10/13benchmarks)的基准测试中,Gemini1.5Pro的核心能力优于 Gemini1.0Ultra;在视觉方面,在77%(10/13benchmarks)的基准测试中,Gemini1.5Pro的核心能力优于Gemini1.0Pro,在46% (6/13benchmarks)的基准测试中,Gemini1.5Pro的核心能力优于Gemini1.0Ultra;在音频方面,在60%(3/5benchmarks)的基准测试中,Gemini1.5Pro的核心能力优于Gemini1.0Pro,在20%(1/5benchmarks)的基准测试中,Gemini1.5Pro的核心能力优于Gemini1.0Ultra。整体而言,Gemini1.5Pro的核心能力全面强于Gemini1.0Pro,谷歌Gemini大模型的核心能力持续提高。 4 资料来源:财联社,谷歌网站,平安证券研究所 【宇信科技】公司发布回购报告书和关于首次回购公司股份的公告。公告称,公司拟回购金额不低于人民币8000万元且不超过人民币15000万元,拟回购价格不超过人民币22.26元/股(含本数),预计占公司当前总股本的比例为0.51%至0.95%。2月5日, 公司通过回购股份专用证券账户以集中竞价交易方式实施了首次回购,回购股份数量为1,995,838股,占公司目前总股本的比例为0.28%,最高成交价为11.076元/股,最低成交价为9.970元/股,成交总金额为20,721,383.88元(不含交易费用)。(公司公告2/5、2/6) 【海光信息】公司发布关于提议回购股份暨公司“提质增效重回报”行动方案的公告。公告称,公司总经理沙超群先生提议以公司自有资金通过集中竞价交易方式进行股份回购,回购股份的资金总额不低于人民币30,000万元(含),不超过人民币50,000万元(含)。(公司公告2/6) 【麒麟信安】公司发布关于以集中竞价交易方式首次回购公司股份的公告。公告称,2月5日,公司通过上交所交易系统以集中竞价交易方式首次回购公司股份389,424股,占公司总股本78,738,639股的比例为0.4946%,回购成交的最高价为37.69元/股,最低价为35.29元/股,支付的资金总额为人民币14,152,274.58元(不含印花税、交易佣金等费用)。(公司公告2/6) 【金山办公】公司发布关于以集中竞价交易方式回购公司股份的回购报告书。公告称,本次回购的股份将全部用于实施员工持股计划、股权激励计划,并将在公司披露股份回购实施结果暨股份变动公告后3年内使用完毕,本次用于回购的资金总额不低于人民币5,000万元(含),不超过人民币10,000万元(含),回购价格不超过人民币380元/股。(公司公告2/8) 【润和软件】公司发布关于以集中竞价交易方式回购公司股份方案的公告。公告称,公司拟使用自有资金以集中竞价交易方式回购公司已发行的部分人民币普通股(A股)股票。本次回购股份用于维护公司价值及股东权益。本次回购股份资金总额15,000万元(含)且不超过人民币30,000万元(含),回购资金来源为公司自有资金。回购价格不超过23.50元/股(含),预 计回购股份数量为6,382,979股至12,765,957股,占公司目前总股本比例为0.80%至1.60%。(公司公告2/9) 资料来源:各公司公告,平安证券研究所 2024年2月5日-2月8日,计算机行业指数上涨5.81%,沪深300指数上涨5.83%,前者跑输后者0.02pc