您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[开源证券]:行业点评报告:Pika、Gemini多模态AI不断突破,AI应用或加速 - 发现报告
当前位置:首页/行业研究/报告详情/

行业点评报告:Pika、Gemini多模态AI不断突破,AI应用或加速

文化传媒2023-12-07方光照、田鹏开源证券M***
AI智能总结
查看更多
行业点评报告:Pika、Gemini多模态AI不断突破,AI应用或加速

Pika1.0AI视频生成能力领先,或引领AI视频热潮,持续利好IP开发领域11月29日,美国AI初创公司Pika labs发布了Pika 1.0,这款产品能够生成和编辑3D动画、动漫、卡通和电影,且制作视频门槛较低,用户只需要输入一句话,就可以生成想要的各种风格的视频,并通过简单的描述,更改视频中的形象和风格。目前Pika 1.0的功能包括:文本生成视频、图像生成视频、视频风格转换、对视频内容进行编辑。在文生视频方面,Pika动画生成的清晰和连贯性强,且具有优秀的语义理解能力,可以直接输入文字来生成不同内容和不同风格的AI视频。除了图生视频,Pika还支持视频生成视频,同时可以直接修改视频中的局部内容以及视频尺寸。我们认为,Pika1.0的推出是AI视频生成产品的一次重大升级,或大幅提高AI视频生产效率,正式开放后有望引领AI视频热潮,同时推动音乐、动画、影视等IP开发大幅降本增效,打开收入增量空间。 谷歌发布Gemini,多模态能力或超GPT-4,有望进一步拓展应用场景 12月7日,谷歌发布了AI大模型Gemini,作为多模态大模型,Gemini可以同时识别和理解文本、图像、音频、视频和代码五种信息,且对信息的理解非常精准。Gemini包含三个版本:适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro以及适用于端侧设备的Gemini Nano。Gemini Ultra是首个在MMLU任务上表现优于人类专家的大模型,取得90.0%的成绩。作为对比,人类专家的成绩为89.8%,GPT-4为86.4%。从测评数据上来看,Gemini的性能在多模态任务上全面超越GPT-4V,或进一步拓展多模态大模型的应用场景。此前,OpenAI于11月份发布了GPT-4Turbo且开放了GPTs,谷歌紧随其后发布了Gemini,海外科技巨头之间多模态大模型的竞争日益激烈,同时驱动着底层多模态大模型的能力不断突破,叠加GPTs等AI应用形式的出现,AI应用有望迎来快速增长期。 AI应用或加速落地并开启商业化,加码布局AI应用 我们认为,以Pika 1.0和Gemini为代表的AI多模态模型不断突破,或推动大模型在工具、教育、办公、电商、营销等领域的应用加快落地并打开商业化空间。 建议继续布局AI应用的两个方向:一是已推出产品并开启商业化的AI应用领域:工具、教育、音乐、校对、营销等;二是将受益于AI视频生成等AI多模态模型的游戏、影视等IP开发领域。(1)“AI+工具”受益标的为昆仑万维。(2)“AI+教育”受益标的为世纪天鸿。(3)“AI+音乐”重点推荐盛天网络。(4)“AI+校对/动画”受益标的为果麦文化。(5)“AI+游戏”受益标的为掌趣科技。(6)“AI+营销/虚拟人”受益标的包括蓝色光标、因赛集团、元隆雅图、引力传媒等。 (7)“AI+IP/影视/视频”受益标的包括上海电影、奥飞娱乐、中文在线、华策影视、捷成股份、万兴科技、易点天下等。 风险提示:多模态大模型技术发展不及预期;AI应用商业化进展不及预期。 附表1:受益标的包括游戏、教育、营销、影视、IP等板块