行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

传媒行业点评报告：多模态模型再迎新突破，继续布局AI应用及算力

文化传媒 2024-02-17 方光照,田鹏开源证券大熊

OpenAI与谷歌在AI视频生成领域的最新进展

OpenAI发布Sora模型

特点：Sora是OpenAI首个文生视频模型，能生成长达60秒的视频，包含细腻的背景、复杂的多角度镜头和情感丰富的角色。
技术亮点：基于ChatGPT和DALL·E的技术，Sora在细节呈现、物理世界理解、情感表现等方面展现出色性能。
目标：致力于让AI理解并模拟物理世界，以辅助解决需要现实世界交互的问题。

谷歌发布Gemini 1.5

版本更新：Gemini 1.5 Pro是谷歌推出的最新版本，为早期测试设计，是中型多模态模型。
性能提升：Gemini 1.5 Pro的上下文窗口容量增加，可以处理大量信息，如视频、音频和文本数据，一次性处理量高达100万个token。
应用案例：展示对复杂信息的高效处理能力，如分析、分类和总结大规模文档或视频内容。

AI视频生成与多模态模型的发展趋势

技术创新：随着Pika、Gemini 1.0、Sora和Gemini 1.5的相继发布，AI视频生成技术不断进步，融合了多模态信息处理能力。
行业影响：AI视频生成技术在影视、动画、游戏、音乐等领域展现巨大潜力，促进内容创作效率提升和成本降低，同时开拓新的变现途径。
算力需求增长：随着AI应用的深化，对计算资源的需求持续增加，推动算力市场的发展。

投资建议

AI应用：聚焦于AI+影视、动画、游戏领域的公司，如芒果超媒、阅文集团、奥飞娱乐等。
算力方向：关注算力相关的公司，如顺网科技、天娱数科、平治信息等。

风险提示

技术进展风险：多模态大模型的开发可能面临技术挑战，商业化进程可能不如预期。
商业化风险：大模型的应用落地可能受到市场接受度、政策法规等因素的影响，存在不确定性。

OpenAI发布首个文生视频模型Sora，可输出长达60秒的视频 2月16日凌晨，OpenAI发布了首个文生视频模型Sora。Sora可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。目前官网上已经更新了48个视频demo，在这些demo中，Sora不仅能准确呈现细节，还能理解物体在物理世界中的存在，并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。整体来看，Sora生成的视频噪音比较少，原始的训练数据比较“干净”，而且基于ChatGPT、DALL·E文生图技术能力，Sora视频生成技术更加高超。此外，OpenAI表示，他们正在教AI理解和模拟运动中的物理世界，目标是训练模型来帮助人们解决需要现实世界交互的问题。谷歌发布Gemini1.5，多模态能力大幅增强 2月16日，谷歌宣布推出Gemini 1.5。谷歌现在推出的是用于早期测试的Gemini 1.5的第一个版本-Gemini 1.5 Pro。它是一种中型多模态模型，针对多种任务的扩展进行了优化，其性能水平与谷歌迄今为止最大的模型1.0Ultra类似。谷歌增加了1.5 Pro的上下文窗口容量，该大模型现在可以在生产环境中运行多达100万个token。这意味着1.5 Pro可以一次性处理大量信息，包括1小时的视频、11小时的音频、超过3万行代码或超过70万个单词的代码库。1.5 Pro可以在给定提示内无缝分析、分类和总结大量内容。例如，当给出阿波罗11号登月任务的402页记录时，它可以推理整个文档中的对话、事件和细节。1.5 Pro可以针对包括视频在内的不同模式执行高度复杂的理解和推理任务。例如，当给定一部44分钟的巴斯特・基顿无声电影时，该模型可以准确分析各种情节点和事件，甚至推理出电影中容易被忽略的小细节。Gemini 1.5 Pro在扩大上下文窗口后，依然保持了高水平的性能。支持AI视频生成的多模态模型不断突破，继续布局AI应用及算力当前AI技术已迅速越过文生文和Chatbot阶段，大举进入视频生成领域。从Pika、Gemini1.0到Sora和Gemini1.5，支持AI视频生成的AI多模态模型不断突破，特别是Sora能够理解和模拟现实世界的模型基础，有望成为实现AGI的重要突破节点。AI视频生成等多模态模型有望在影视、动画、游戏、音乐等IP开发中发挥更大作用，继续推动IP开发降本增效，带来增量变现空间，并拉动算力需求。建议布局AI应用及算力方向：（1）AI+影视/动画IP重点推荐芒果超媒、阅文集团、奥飞娱乐，受益标的包括上海电影、中文在线、华策影视、捷成股份等。（2）AI+游戏重点推荐盛天网络、恺英网络、神州泰岳、姚记科技、腾讯控股、网易-S、完美世界、吉比特、心动公司、创梦天地，受益标的包括星辉娱乐、掌趣科技、汤姆猫、宝通科技、巨人网络、游族网络、三七互娱等。（3）算力板块受益标的包括顺网科技、天娱数科、平治信息、浙数文化等。风险提示：多模态大模型进展不及预期；大模型商业化落地进展不及预期。附表1：受益标的包括IP、游戏、算力等板块

点击免费查看完整报告

传媒行业点评报告：多模态模型再迎新突破，继续布局AI应用及算力

OpenAI与谷歌在AI视频生成领域的最新进展

OpenAI发布Sora模型

谷歌发布Gemini 1.5

AI视频生成与多模态模型的发展趋势

投资建议

风险提示

你可能感兴趣

传媒行业周报：Vidu引领国内视频模型再突破，继续布局AI应用

传媒周一行业谈大厂加速模型升级继续布局游戏等多模态AI应用20251222

传媒周一行业谈：大厂加速模型升级，继续布局游戏等多模态AI应用

传媒行业周报国内AI多模态持续突破，继续布局AI应用

传媒行业周报：AI Agent、多模态AI持续突破，继续布局AI应用

传媒行业周报：政策助力文娱消费，多模态再突破，布局AI及IP

传媒行业点评报告：吉卜力风格AI动漫再验多模态AI进化，继续布局AI

行业周报：《异环》三测及字节AI视频模型惊艳，继续布局游戏、多模态AI应用

传媒行业：海外AI再度加速：多模态模型突破与应用革新

传媒行业周报：模型与应用再升级，新游表现亮眼，继续布局AI、IP行业周报