行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

计算机行业周报：智谱清影推动视频生成大模型普及

信息技术 2024-07-28 陈涵泊,王思德邦证券话唠

计算机行业周报概要

主要亮点与市场表现

智谱AI版Sora清影发布：智谱AI推出了面向所有用户的AI视频生成工具“清影”，可实现快速、高质量的视频创作，支持多种视频风格和音乐搭配，显著提高了视频生成效率和质量。
Scaling Law验证与多模态融合：清影采用独特的transformer架构，集成文本、时间和空间三个维度，通过3D全注意力机制和自研的3D VAE及RoPE，实现了高效的内容连贯性和指令遵循能力。
AI视频生成的多模态应用爆发：国内外多个公司相继推出AI视频生成产品，包括快手、PixVerse、Runway Gen、Dream Machine等，这些产品在物理模拟、运动流畅度、对提示词的理解等方面持续优化，为多模态应用的爆发蓄能。

投资建议

关注AI多模态：万兴科技、虹软科技、当虹科技、中科创达、大华股份、海康威视、漫步者、萤石网络、汉仪股份、美图公司、云从科技等企业。
关注AI算力：云赛智联、思特奇、恒为科技、海光信息、寒武纪、景嘉微、工业富联、拓维信息、浪潮信息、四川长虹、神州数码等企业。
关注AI+行业应用：金山办公、万兴科技、福昕软件、彩讯股份、金蝶国际、泛微网络、致远互联、鼎捷软件、汉得信息、用友网络等企业。
关注AI在教育、电商、医疗领域的应用：科大讯飞、佳发教育、鸥玛软件、盛通股份、值得买、焦点科技、小商品城、润达医疗、嘉和美康、创业慧康等企业。

风险提示

技术发展不及预期的风险。
商业模式不成熟的风险。
AI伦理风险。

市场表现概览

计算机行业与沪深300指数的对比显示，自2023年7月至2024年3月，计算机行业指数表现相对稳定，整体市场波动幅度约为-43%至+9%，相较于沪深300指数表现出一定的波动性。这反映了计算机行业在这一时期内的市场表现与整体市场的相对关系。

智谱AI版Sora清影发布，人人可用、半分钟快速创作视频的时代已来。7月26日，智谱AI旗下“智谱清言”APP正式上线了AI视频生成功能“清影”，向所有用户全量上线，无需预约，人人可用。清影理论上仅需30秒即可完成6秒1440×960清晰度高精度视频的生成，展现出亮眼的推理速度，不仅具备高效的指令遵循能力，还具有内容的连贯性和调度灵活性，而可灵AI生成5秒视频一般耗时2-5分钟。清影同时支持文生视频与图生视频，视频风格覆盖卡通3D、黑白、油画、电影感等，并可配上音乐，生成更为灵动有质感的视频画面。此外，清影API也同步上线大模型开放平台bigmodel.cn，企业和开发者可通过调用API的方式体验视频生成模型能力，推动多模态大模型普及。清影再次验证Scaling Law在视频生成领域的能力，对齐多模态朝AGI迈进。清影底座的视频生成模型是CogVideoX，并非完全照搬DiT架构，更注重视频与其他模态的对齐融合。具体而言，清影采用将文本、时间和空间三个维度全部融合的transformer架构，摒弃了传统的交叉注意力模块，而是在输入阶段就将文本embedding和视频embedding结合起来，以便充分交互两种模态。其中，注意力模块采用了3D全注意力机制，先前的研究通常使用分离的空间和时间注意力或者分块时空注意力，它们不仅增加了建模难度，同时无法与现有的高效训练框架适配；在内容连贯性上，智谱AI自研3D VAE，将原视频空间压缩至2%大小，配合位置编码模块3D RoPE，更有利于在时间维度上捕捉帧间关系，建立起视频中的长程依赖；在指令跟随上，智谱AI自研端到端视频理解模型，用于为海量的视频数据生成详细的、贴合内容的描述，从而能够更充分理解和执行用户给出的指令。国内外类Sora纷纷袭来，下游多模态应用爆发正在蓄能。根据APPSO微信公众号统计，自Sora发布以来，已有不下10家公司推出了AI视频新产品或大更新，在几个月内，AI视频生成在物理模拟、运动流畅度、对提示词理解方面都有大幅的提升。这段时间，快手可灵AI在全球开放内测；PixVerse发布了V2版本，支持一键生成1-5段连续的视频内容；Runway Gen 3 Alpha开启付费用户公测，细节的精致度和丝滑程度上均有提升；电影级视频生成模型Dream Machine，更新了首尾帧功能。视频生成模型已具备一定生产能力，各厂商通过低价或会员等机制努力吸引创作者，为下游多模态应用的爆发蓄能。以清影为例，文生视频、图生视频可灵活应用之广告制作、剧情创作、短视频创作等领域。国内首部AIGC奇观剧《山海奇镜之劈波斩浪》，十余人的创作团队取代传统百人规模，大大缩短制作周期和成本，验证多模态大模型下游应用的前景。投资建议。智谱清影人人可用的理念有望加速多模态大模型的普及，激发多模态应用创新活力，同时清影落地也离不开地方算力的支持。建议关注AI多模态：万兴科技、虹软科技、当虹科技、中科创达、大华股份、海康威视、漫步者、萤石网络、汉仪股份、美图公司、云从科技；AI算力：云赛智联、思特奇、恒为科技、海光信息、寒武纪、景嘉微、工业富联、拓维信息、浪潮信息、四川长虹、神州数码； AI+办公：金山办公、万兴科技、福昕软件、彩讯股份、金蝶国际、泛微网络、致远互联、鼎捷软件、汉得信息，用友网络；AI+教育/电商/医疗：科大讯飞、佳发教育、鸥玛软件、盛通股份、值得买、焦点科技、小商品城、润达医疗、嘉和美康、创业慧康等。风险提示：技术发展不及预期，商业模式不成熟、AI伦理风险等。

点击免费查看完整报告

计算机行业周报：智谱清影推动视频生成大模型普及

计算机行业周报概要

主要亮点与市场表现

投资建议

风险提示

市场表现概览

你可能感兴趣

传媒行业周报：智谱推出AI视频模型“新清影”，视频生成开启“有声”时代

传媒互联网行业周报：2024年Chinajoy顺利闭幕，智谱发布清影视频创作智能体

传媒行业周报：WAIC2024开幕，商汤发布可控人物视频生成大模型Vimi

全球科技行业周报：混元大模型将上线视频生成功能，关注金融IT机会

互联网传媒行业周报：OpenAI发布文生成视频大模型，Sora引领AI视频创新

互联网传媒行业周报：周观点：网易有道发布教育大模型“子曰”，Runway视频生成工具Gen-2全面开放

计算机行业周报：AMDRDNA4GPU架构显卡曝光，智谱发布基座大模型GLM-4-Plus

计算机行业周报（20251215-20251219）：智谱、稀宇通过聆讯，大模型厂商上市在即

传媒行业周观点：智谱推出“清影”升级版，《宝可梦大集结》国服正式上线

计算机行业周报：Genio 720和Genio 520联合发布，视频生成模型Open-Sora 2.0发布