热门搜索：

计算机行业点评：视频AIGC加速突破，多模态应用发展正当时

信息技术2023-12-03天风证券E***

AI智能总结

视频生成与编辑算法的突破与应用

视频生成与编辑技术进展

扩散模型：扩散模型在视频生成领域取得了快速突破，取代了传统基于生成对抗网络（GANs）和自回归变换器的方法。自Video Diffusion Model首次提出以来，扩散模型在2023年迎来学术研究的显著增长。
产品迭代与用户增长：Runway、Pika等公司的产品在这一领域持续迭代。Runway自3月测试GEN-2模型，至6月正式发布，并在11月更新4K模式，显著提升了视频生成的一致性和质量，解决了不连贯、闪烁变形等问题。Pika在Discord推出服务器后，用户数量于11月超过50万，11月29日发布Pika1.0，增加了画布扩展、局部修改、视频时长拓展等功能。

多模态AI应用分析

GPTs应用概况：截至12月1日，GPTs应用数量突破3万，其中多模态AIGC与效率工具应用最为流行，分别占5个和3个位置，显示了用户对图像、视频生成和写作工具的需求。
应用实例：排名前五的GPTs应用涵盖了科研、多模态生成、图像视频生成、博客写作等领域，表明多模态AIGC与效率工具是GPTs应用的重要组成部分。

未来前景与投资机会

视频多模态AI产业机会：文生视频作为新兴领域，面临高算力成本和数据集不足等挑战，但视频扩散模型的技术突破推动了算法模型的创新，如Video LDM、Text2Video-Zero等。企业如Runway在近半年内取得了显著进展，提高了视频生成的一致性和保真度。看好未来视频多模态领域的应用机会及算力基础设施的增长潜力。
重点关注公司：在多模态应用领域，建议关注万兴科技、美图公司（与海外组联合覆盖）、易点天下、网达软件、焦点科技、当虹科技。在算力方面，推荐关注华为昇腾相关的神州数码、高新发展、烽火通信、拓维信息、广电运通，以及非华为国产AI芯片领域的海光信息、寒武纪、云天励飞、景嘉微（与电子组联合覆盖）。

风险提示

自主芯片技术可能未达预期。
视频多模态技术的发展速度可能低于预期。
应用推广可能不如预期。

采取扩散模型的视频生成与编辑算法取得快速突破，Runway、Pika等公司产品持续迭代在图像生成领域，以扩散模型为代表的方法已经取得了特别成功，迅速取代了基于生成对抗网络（GANs）和自回归变换器的方法。同样自从Video Diffusion Model首次尝试设计用扩散模型用于视频生成后，扩散模型在视频生成，于2023年迎来了学术上的快速发展，相应的论文数量显著增加。相应的，Runway、Pika等公司的产品也在取得持续突破，Runway从3月份测试GEN-2模型开始，6月份正式向公众发布，随后在11月更新了4K模式，生成视频的一致性也迎来了重大改进，不连贯、闪烁变形等问题逐步解决。Pika在7月份于Discord推出服务器，截至目前用户已超50万，随后在11月29日推出了Pika1.0，用户能够通过Pika实现画布延展、局部修改、视频时长拓展等编辑需求。 GPTs应用数量突破3万，截止12月1日，最佳GPTs应用聚焦于多模态AIGC与效率工具从最流行的10个GPTs应用来看，5个为包括图像和视频生成在内的多模态AIGC领域，3个为与包括写作在内的效率工具，其余2个为与Coding相关、主要面向开发者的网页设计，排名前五的分别是面向科研人员的ResearchGPT、多模态生成的Brick Box Generator、Photo Multiverse、VideoGPT by VEED，和撰写博客等文章的Bloggy:Automated Blog Post Writer。我们认为从排名靠前的应用中可以看出多模态AIGC与效率工具有可能是GPTs应用中的重要部分，多模态领域较高的比重也说明了图片与视频模态的生成是用户需求的主要方向之一。 text-to-video技术的奇点正在加速到来，我们看好视频多模态领域的AI产业机会文生视频是一个年轻的方向，该领域面临多方面的挑战，包括高算力成本、缺乏高质量的数据集等，但随着视频扩散模型技术的突破，Video LDM、Text2Video-Zero、Runway Gen1、Runway Gen2等算法模型不断涌现，我们也看到以Runway为代表的企业在近半年内取得了较大的进步，生成视频的一致性和保真度也有了较大改进,我们看好未来在视频多模态领域的应用机会，同时算力基础设施在视频模态技术的带领下也有望迎来快速增长。建议关注多模态应用：万兴科技、美图公司（与海外组联合覆盖）、易点天下、网达软件、焦点科技、当虹科技算力：（1）华为昇腾：神州数码、高新发展、烽火通信、拓维信息、广电运通；（2）非华为国产AI芯片：海光信息、寒武纪、云天励飞、景嘉微（与电子组联合覆盖）风险提示：自主芯片技术不及预期、视频多模态技术发展速度不及预期、应用推广不及预期表1：GPTs中流行的10个应用概述

点击免费查看完整报告

你可能感兴趣

计算机行业点评：视频AIGC加速突破，多模态应用发展正当时

视频生成与编辑算法的突破与应用

视频生成与编辑技术进展

多模态AI应用分析

未来前景与投资机会

风险提示

你可能感兴趣

计算机：Pika文生视频能力跃迁，AIGC多模态应用加速推进

计算机行业周观察：多模态大模型将加速AIGC应用发展

计算机：Pika1.0发布，多模态AIGC应用有望加速落地

AIGC行业趋势：Sora横空出世，向多模态应用加速迈进

【财联社早知道】谷歌Gemini AI新计划曝光，多模态不断突破或推动AI应用打开商业化空间，这家公司的多媒体大模型涵盖语言、音频、图像、视频等多模态能力