多模态模型和端侧AI再迎突破,鸿蒙原生智能推出,继续布局AI应用 6月18日,Google Deepmind发布了视频生成音频(V2A)技术进展,采用视频像素和文本提示来生成与底层视频同步的音频波形,可为视频创建戏剧性的背景音乐、逼真的音效及人物间对话;6月18日,博纳影业亦宣布由旗下AIGMS制作中心联合抖音、即梦AIGC创作平台出品的AI生成式连续性叙事科幻短剧《三星堆:未来启示录》第一季将于暑期上线,开启影视与AI深度融合新篇章。6月21日华为开发者大会上 ,华为带来全新的盘古大模型5.0、HarmonyOS NEXT等,盘古大模型5.0能更精准地理解文本、图片、视频、红外等多模态,HarmonyOS NEXT首次将AI能力融入系统,围绕图像、通话、文档智能及跨应用协同等,和开发者共同打造生态级鸿蒙原生智能。我们认为,国内外大模型的视频生成、物理世界理解等多模态能力仍在持续提升,而两大智能终端头部厂商苹果AI和华为鸿蒙原生AI的先后推出,有望加速智能手机换机潮,拉动AI手机出货量及相应AI应用装机量增长,推动Agent、影视、音乐、教育、营销等领域AI应用商业化空间进一步打开,建议继续布局AI应用。(1)AI Agent:重点推荐腾讯控股,受益标的包括昆仑万维;(2)AI影视:重点推荐快手-W、上海电影,受益标的包括捷成股份、美图公司、华策影视、中文在线、光线传媒等。(3)AI音乐:重点推荐盛天网络、云音乐,受益标的包括腾讯音乐等。(4)AI教育:受益标的包括世纪天鸿、南方传媒、盛通股份等。(5)AI营销:受益标的包括引力传媒、因赛集团、蓝色光标等。 新游上线潮延续,关注头部游戏表现,继续布局游戏板块 近期上线的新游延续良好表现,七麦数据显示,6月13日上线的哔哩哔哩发行的三国题材SLG手游《三国:谋定天下》近7日iphone游戏畅销榜排名维持前5,5月国服上线的腾讯《DNF手游》和心动公司《出发吧麦芬》近7日iPhone游戏畅销榜排名分别为1-2和7-12,暑期还有腾讯《创造吧!我们的星球》(6月26日)《极品飞车:集结》(7月11日)、米哈游《绝区零》(7月4日)、网易《燕云十六声》(7月26日)将上线。我们建议继续关注头部新游上线表现及对相关研发、发行商的业绩驱动,重点推荐心动公司、腾讯控股、网易-S、创梦天地、姚记科技、恺英网络,受益标的包括哔哩哔哩-W、中手游等。 暑期临近,继续关注电影、演艺、展会等暑期文旅消费 暑期档有包括《野孩子》(7月12日)、《接班人计划》(7月18日,万达电影、猫眼娱乐等出品)、《喜羊羊与灰太狼之守护》(7月19日,奥飞娱乐等出品)、《异人之下》(7月26日,阅文集团等出品)《逆行人生》(8月9日,中国儒意等出品)等多部新片将陆续上映;另外,由锋尚文化出品的沉浸式演出《湘湖·雅韵》将于6月30日首演,顺网科技旗下汉威信恒举办的ChinaJoy2024展会将于7月26-29日进行。我们建议持续关注电影、演艺、展会等暑期线下文旅消费,重点推荐奥飞娱乐、阅文集团,受益标的包括锋尚文化、顺网科技、万达电影、博纳影业、阿里影业、猫眼娱乐、中国儒意、中国电影等。 风险提示:AI应用商业化进展、新游戏流水、电影票房等低于预期。 1、行业数据综述:《吟游战记》获得本周内地iOS游戏免费 榜冠军,《地下城与勇士》获得本周内地iOS游戏畅销榜冠军; 电影《云边有个小卖部》获得周票房冠军 根据七麦数据,截至2024年6月22日22:00,《吟游战记》获内地iOS免费榜第一,《地下城与勇士》获内地iOS畅销榜第一。 根据TapTap,截至2024年6月22日22:00,《永劫无间手游》为安卓预约榜第一与iOS预约榜第一。 图1:iOS游戏免费榜排名——《吟游战记》为内地iOS免费榜第一(2024.6.16-2024.6.22)(截至时间:2024.6.22 22:00) 图2:iOS游戏畅销榜排名——《地下城与勇士》为内地iOS畅销榜第一(2024.6.16-2024.6.22)(截至时间:2024.6.2222:00) 表1:重点公司游戏产品iOS游戏畅销榜排名——《三国:谋定天下》维持排名靠前(2024.6.16-2024.6.22)(截至时间:2024.6.2222:00) 表2:TapTap新游安卓预约榜排名——《永劫无间手游》为本周预约热度榜第一(2024.6.16-2024.6.22)(截至时间:2024.6.22 22:00) 表3:TapTap新游iOS预约榜排名——《永劫无间手游》为本周预约热度榜第一(2024.6.16-2024.6.22)(截至时间:2024.6.2222:00) 表4:院线电影数据—《云边有个小卖部》周票房获第一(2024.6.16-2024.6.22)(截至时间:2024.6.22 22:00) 表5:网播剧数据—《墨雨云间》周播映指数维持第一(2024.6.16-2024.6.22)(截至时间:2024.6.22 22:00) 表6:网播综艺数据—《乘风2024》周播映指数排名第一(2024.6.16-2024.6.22)(截至时间:2024.6.22 22:00) 表7:台播剧数据—《玫瑰的故事》维持周市占率领先(2024.6.16-2024.6.22)(截至时间:2024.6.22 22:00) 表8:台播综艺数据—《奔跑吧第八季》周市占率维持第一(2024.6.16-2024.6.22)(截至时间:2024.6.22 22:00) 2、行业新闻综述:第26届上海国际电影节举办,AI模型及 应用持续演进 2.1、AIGC:谷歌发布视频生成音频技术,华为盘古大模型5.0发布 (1)谷歌发布视频生成音频技术,AI视频进入有声时代(2024.6.18) 6月18日,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐,逼真的音效,甚至是人物之间的对话。V2A技术支持为AI生成视频“配乐”,Google还特别强调了官网发布的Demo视频都是由在五月份发布的生成视频模型“Veo”和V2A技术合作打造。V2A技术会采用视频像素和文本提示来生成与底层视频同步的音频波形。市面上的大多数模型,不管是Sora、Luma,还是刚刚发布的Gen-3 Alpha,都只能生成无声视频,而V2A技术能够使AI视频进入“有声时代”,进一步推动AI在视听方面的完善与发展。(资料来源:AI新榜) (2)Anthropic发布全新大模型Claude 3.5 Sonnet(2024.6.20) 6月20日,Anthropic发布了全新大模型Claude 3.5 Sonnet,号称是迄今为止最智能的模型。据介绍,Claude 3.5 Sonnet是Anthropic即将推出的Claude 3.5系列的首个版本。该模型提高了整个领域的智能水平,在绝大多数基准评估中都超越了竞品大模型和自家前代最强Claude 3 Opus。与此同时,运行速度、成本与自家前代C laude 3 Sonnet相当。Claude 3.5 Sonnet的运行速度是Claude 3 Opus的两倍。Claude 3.5与GPT-4o的对比数据,除了数学方面,得分都比GPT-4o高或者逼近。此外,Claude 3.5 Sonnet已经可以直接通过Anthropic API、亚马逊云科技Bedrock等渠道使用。除了开发下一代大模型之外,Anthropic正在开发新的模式和功能,以支持更多企业用例,包括与企业应用程序的集成。团队还在探索诸如Memory之类的功能,使得模型能够记住用户的偏好和指定的交互历史,从而实现更加个性化和高效的体验。(资料来源:机器之心) (3)华为盘古大模型跳级发布,纯血鸿蒙OS即将上机P70(2024.6.17) 在2024华为开发者大会上,盘古大模型跳级发布,没有4.0,直接发布5.0。 最新系列覆盖十亿、百亿、千亿、万亿四种规模,分别针对当下大模型领域的不同应用需求。同时还强调了多模态和强思维两方面属性。多模态方面,盘古大模型5. 0能够更好更精准地理解物理世界,包括文本、图片、视频、雷达、红外、遥感等更多模态。强思维方面,复杂逻辑推理是大模型成为行业助手的关键。盘古大模型5.0将思维链技术与策略搜索技术深度结合,极大提升了数学能力、复杂任务规划能力。鸿蒙系统也用上了最新盘古,华为智慧助手小艺的多模态能力,就得益于盘古。HarmonyOS NEXT现在已正式开启面向开发者和先锋用户的beta升级。余承东也在现场宣布,鸿蒙原生应用已进入全面冲刺阶段,5000多个常用应用已全部启动开发,其中超过1500家已完成上架。华为自研仓颉编程语言正式亮相,意味着鸿蒙生态补齐了“最后一环”。(资料来源:量子位) (4)DreamTech推出全球首个原生3D-DiT大模型Direct3D(2024.6.17) 2024年5月,DreamTech官宣了其高质量3D生成大模型Direct3D,并公开了相关学术论文。这是首个公开发布的原生三维生成路线的3D大模型,通过采用3D Diffusion Transformer(3D-DiT),解决了长期以来困扰行业的高质量三维内容生成难题。随着Direct3D的推出,3D生成领域大步跨越进入了商用时代。Direct3D因为采取的是原生3D技术路线,训练集中仅使用3D数据,其所生成的3D模型质量也更接近原始质量,完美解决了几何结构、模型精度、表面细节、mesh面片数量等核心问题。Direct3D所生成的模型质量已经超出了家用打印机的精度上限,只有更高规格的商用及工业打印机才能充分还原所生成模型的精细度。(资料来源:机器之心) (5)Runway最新视频生成模型上线,可生成10秒高保真、高动态视频(20 24.6.18) 6月17日,美国AI视频生成创企Runway推出新的视频生成模型Gen-3 Alpha,支持生成10秒左右的高质量视频。时隔一年,Gen-3 Alpha是Runway的反击之作。 Gen-3 Alpha的一大特点是生成的视频具有高精细度,它可以理解并生成复杂的场景和运动画面,还能胜任多种电影艺术手法。相较于Gen-2,Gen-3 Alpha在保真度、一致性和运动性能上都有了显著的提升,被Runway称为“构建通用世界模型道路上”的重要一步。目前,该模型的确切发布日期还未公布,Runway仅展示了演示视频。Runway联合创始人兼首席技术官Anastasis Germanidis透露,Gen-3 Alpha将在未来几天内首先面向付费用户提供。(资料来源:智东西) (6)国产Sora代码权重全开源,16秒720p画质电影感拉满(2024.6.18) 潞晨Open-Sora团队在720p高清文生视频质量和生成时长上实现了突破性进展.全新升级的Open-Sora不仅支持无缝产出任意风格的高质量短片,而且更令人惊喜的是,团队选择将模型权重和训练代码全面开源。LambdaLabs,美国科技界独角兽,基于潞晨团队先前开源的Open-Sora模型权重打造了一个数字乐高宇宙,乐高迷们在这里找到了极致的创意体验。潞晨Open-Sora团队不仅持续开源模型权重,还在Github上晒出了技术路线,让每个玩家都能成为文生视频大模型的掌控者,不再是单纯的围观群众。(资料来源:新智元) (7)松鼠Ai多模态智适应教育大模型全新升级(2024.6.22) 6月18日,松鼠Ai全新多模态智适应大模型发布会于上海隆重召开。此次发布上,松鼠Ai揭晓了重磅升级的智适应教育大模型,其在多模态智能错因分析与追根溯源、多模态智能人机互动、多模态智能测试与评估三大维度实现了全面迭代。 人机交互上也达到了全新高度,支持文字与语音互动,覆盖100+互动对话场景。相比前代,新版本在章节测评性能上实现超100%的飞跃,尤其在主观题评分上,能够精准给出分