您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华金证券]:AI应用落地深度分析报告:AI落地切实推动内容与营销产业快速增长 - 发现报告
当前位置:首页/行业研究/报告详情/

AI应用落地深度分析报告:AI落地切实推动内容与营销产业快速增长

文化传媒2024-10-11倪爽华金证券惊***
AI智能总结
查看更多
AI应用落地深度分析报告:AI落地切实推动内容与营销产业快速增长

证券研究报告传媒/行业深度报告领先大市-A(维持) AI落地切实推动内容与营销产业快速增长 AI应用落地深度分析报告 分析师:倪爽S09105230200032024年10月11日 本报告仅供华金证券客户中的专业投资者参考请仔细阅读在本报告尾部的重要法律声明 大模型的发展开启了AIGC时代,当前多模态发展趋势清晰,AI视频生成正在迅速发展。目前大模型已从早期的技术驱动转向生态驱动,AI技术持续商业化应用与落地。 在互联网各个应用场景中,移动视频、移动社交占据近6成的移动互联网用户时长,其中移动视频时长占比仍在进一步增长。2023年9月,五大新媒体平台(抖音、快手、微博、小红书、B站)去重活跃用户规模10.88亿,全网渗透率达88.9%,内容对于流量的驱动作用进一步提升。 AIGC技术应用与落地带来的提质、降本、增效,推动内容产业供给端持续繁荣,创作门槛明显降低,创作人群扩张,互联网广告、直播电商规模呈增长趋势,内容产能和商业变现实现双提升。 2023年中国AI基础数据服务市场规模为45亿元。预计未来五年的复合增长率超30%。国家统计局数据显示:2024年上半年,信息传输、软件和信息技术服务业增长11.9%。AI在数据采集、分析和运营等领域发挥了更大作用。尤其在营销领域,随着AI与算力的快速发展,数据分析有望更全面的分析、预测用户行为,从而用于精准推送,并依靠自动化服务进一步降本增效,推动广告营销业务流程重塑和产品价值创新。2024年Q1和Q2,我国互联网广告市场规模分别为1649.1亿元和1864.9亿元,分别实现了12.8%和10.9%的同比增长,增速较过去几年有显著提高。2023年以来,随着AI应用带来的广告投放与销售转化效率提升,多家互联网企业广告营销收入增长加速。 推荐关注AI落地推动收入显著增长的互联网平台,如腾讯控股、美团-W、快手-W和Bilibili-W等。营销服务方向的蓝色光标等;AI内容应用端的昆仑万维、视觉中国、捷成股份和中文在线等。 风险提示:AI技术发展不及预期;AI技术落地应用进度不及预期;宏观经济与政策不确定性等。 01 大模型和AI应用高速发展 02 03 04 AI推动内容丰富,创作降本增效AI与算法应用推动营销效率提升投资建议 05 风险提示 大模型的发展开启AIGC时代(第四次AI浪潮),技术是AI每次革命性发展的起点,商业应用与落地则是AI发展的加速器。 大模型的数量及能力均不断上升,AIGC应用爆发具有技术基础;技术爆发后迎来商业加速,应用热度上升。 随着人工智能技术的飞速发展,大模型(包括开源模型及闭源模型)的数量和能力都在显著增长,为AIGC(人工智能生成内容)应用的爆发提供技术基础。当前大模型厂商凭借自身模型基础,扩充应用场景构筑自有生态。海外风险投资公司YCombinator统计,全球AIGC融资热度在2024年加速上升,从侧面显示其商业价值逐步受到关注。 大模型变迁 全球及中国AIGC融资数量 多模态模型能够提供更加全面的认知能力和丰富的交互体验,拓宽AI处理复杂任务的应用范围是其通用人工智能的重要路径之一。例如,OpenAl的Sora模型推出使得全球多模态大模型的发展得到关注。 AI生产力提升将改善传统工作流程。大模型应用或将影响人机交互方式和机器原有的决策能力,以上两方面的提升将对原有内容生产力再次释放,结合对产业上下游链条和生态合作方式,进而改变整体数字管理体系。 AIGC以内容生成为核心,结合商业应用的不断迭代,最终指向数字工作作业模式及治理模式的改变。 单模态模型VS多模态模型 内容生产变迁 内容生成成本下降,生成效果提升; 内容形态的生产时间大幅降低 直接价值 间接价值 基于内容的提高;人与人之间,人与机器之间的交互效率;工作流程改变 生产力显著提升,生产关系逐步发生变化;工作范式或核心需求发生改变 最终价值 多模态发展趋势清晰,文本、图像商业化规模和成熟度较高,AI视频生成正在迅速发展。 各类型商业化进程 概况 关键节点 代表应用 文本 大语言模型在文字处理上面的卓越表现开启了生成式A1的浪潮,基础模型能够基于语言进行推理是智能的重要表现在各个领域应用最为成熟,例如ChatGPT日活用户已经突破1亿,0penAI在2024年6月ARR的达到34亿美元 2018年6月,由AlecRadford主导在0penA1推出GPT-12020年6月,OpenAl推出GPT-3,引发业界关注,验证scaling路线2022年11月,ChatGPT批起技术浪潮 ChatGPTCharacter.AlGeminAnthropic 图像 文生围领域产生仅次于基础模型的杀手级应用,获得大量创作者和用户关注,成熟度仅次于文本模态Midjhouney已有超过2000万用户,在无投资的情况自我造血,在2023年的营收超过2亿美元 2021年1月,0penAl发布初代文生图模型DALL-E2022年8月,StableDiffusion在Stability.ai的支持下开源,推动社区在图像领域快速发展2023年3月,MidjourneyV5发布,成为现象级应用 StableDiffusionHidjourneyDalI-E3 视频 视频是图像模态的进一步扩展,但由于技术复杂,对于算力、数据等资源要求较高,成热相对文本、图像较慢领军企业已经做出标杆,显著加速领域发展,已出现多家视频生成领域创业公司,但商业化、产品化进展较慢 2022-10月,Google、Meta发布Phenaki、Make-A-Video2023年下半年,创业公司推出Runway-Gen2,StableVideoDiffusion、Pika等产品2024年2月,0penAl发布Sora引发全球关注 SoraRunway快手可灵Pixverse 音频 目前主要是音乐生威成(语音识别、克隆暂不纳入讨论),场不如图片生成、视频生成等领域热门,比视频更加早期明星创业公司较少,但有加速的发展的态势 2024年2月,Suno..ai发布SunoV32024年6月,Stability.Al推出文生音频模型StableAudio0pen SunoStableAudio 3D 技术路线目前尚不清晰,垂直明星创业公司较少,产品大多处于早期阶段,但正在加速发展 2020年8月,NeRF论文发表2022年9月,谷歌发布DreamFusion2023年5月,0penAl开源Shape-E模型2024年7月,Meta发布Meta3DGen Luma.AIMeshy 目前AIGC相关应用中普遍围绕文本与图片生成两项功能与产品应用场景进行适配。 针对各类型使用场景可主要归纳为两种形态: 信息生成:围绕工作场景,用户可借助AI生成所需的文本、图片等内容信息,也可生成办公文档、辅助计算,缩短工作时长,提高效率。 内容总结:借助浏览器AIGC插件总结文字、视频等内容,提升阅读效率,聚焦核心信息,并以标签形式提炼,助力工作提效。 2024年1月AIGCAPP活跃用户规模TOP10 生成式AI使用情况 多轮对话类 (ChatGPT必应期头文心声、Kimi.百度搜系互动1ab等) 写作辅助类 (百度文库、讯飞飞输、百度输入法、NotionAl、腾讯文档A) 办公辅助类 (微软365copilot、百度文库、飞书、如流、钉钉AWPSA) (Midjoumey、百度搜索A图片助手、百度文库智能堆友、文心一格eez。鹿班、腾讯云AI绘画等) 45% 音视频生成类(商汤智影、腾讯智影、剪映史、度加剪辑等) 40% 学习辅助类 35% (星火语伴、AI口语陪练等) 图像生产类 60% 55% 50% 在GAN、Transformer和扩散模型等技术和开源的不断升级,AIGC技术在图像领域的定位逐渐由工具向生产力升级,实用性和商业性增强,降低绘制的技术门槛和二次编辑开发成本,应用于艺术创作、美术设计、营销创意、视觉插画、泛娱乐内容等多领域。 AI绘画工具与技术三次跃迁 早期C端应用以及目前端侧结合 初期发展 过渡时期 多模态大模型:AI绘画逐渐成为大模型核心模态之一,如GPT4-V/Dalle-3 当前形态表现 DiscoDiffusion:开启DALL·E:OpenAl出品, 扩散模型元年,开源之闭源模型代表 先驱 Midjourney:提升创新性,提高AIGC图片曝光度 Gan:早期A绘画实现技术 StableDiffusion:AI绘画最为重要的开源力量,创业生态之基石 早期C端应用 端侧AI生成结合(vivo) 2023年AIGC相关图片应用正式开启“全面商用”时刻。从多样性的艺术维度冲击多样性的行业商业,在流量平台等虚拟内容经济的加持下,互联网用户群开始将AI应用融入日常场景。早期AIGC应用以独立软件为主并产生出部分破圈产品吸引流量,随着生成技术的不断提升部分硬件厂商逐步将相关技术嵌入至产品本身。 AI生成作为图片生成工具降低用户绘制或拍摄门槛,有助于图片内容端持续繁荣。据EVERYPIXEL估算,截止到2023年8月份,AI生成的图像超过过去150年人类拍摄的所有照片数量。 从历史发展规律推演,AIGC创作者经济时代也必然会催生对生成式AI版权的需求,因为新经济的形成和运作离不开对新生产要素的确权。例如,当前的互联网数字经济对数字版权的需求催生以视觉中国为代表的数字版权内容平台。 头部内容平台 AI生成图像数量(共154.7亿张) 未来针对AI生成图片及相关版权问题将成为用户及相关平台的关注之一。 16000 14000 12000 10000 8000 6000 4000 2000 0 15000 2400 1360 3.86 150 500 ShutterstockAIInstagramGooglePinterestFacebook 图片数量(单位:亿,截至23.8) AI文本生成和图像生成相继走向成熟,Sora发布加速视频生成相关技术发展,自身展示该领域较为确定性技术范式,将DiffusionTransformer(DiT)推向主流应用,大量视频生成凭借DiT路线并取得成功。单纯基于语言模型的路线是业界关注的另一条路径,可以更好地融合不同的模态,且可扩展性强,未来可能会有新的进展。 AIGC已经加速迈入视频生成阶段。2024年可实现根据文本提示生成初版短视频,2025年有望实现根据文本生成初版长视频,并在视频制作环节真实使用落地。 2014年GAN 发表,2016年左右开始用于视频生成 2013年VAE出现,可以通过编码器和解码器的机制学习数据的潜在表示 2017年 Transformer发表,逐当向各个领城渗透,早期在视频生成领城也有尝试 2021年Google发布VideoVisionTransformer 2020年DOPV 论文发表 2021年LatentDiffusionModels论文发表2022年VideoDiffusionModel论文发表 2022年12月 DiffusionTransformer论文发表 2024年2月OpenAl发布Sora,取得惊艳的生成效果,验证了Diffusion和Transformer结合的有效性 多步完善过程产生,使其更加符合所需的内容 视频生成正在由检索生成、局部生成走向依靠自然语言提示词的全量生成,生成内容更加灵活丰富,应用空间广阔。 视频生成模型发展 Sora技术推演 视频生成模型发展在技术确立下,算力将驱动模型快速进步,稳定性、可控性、丰富度将持续提升,解锁更多应用空间: 训练侧,视频模型发展遵循ScalingLaw,需要在Scalable的模型架构上增加数据和算力来提升模型能力。 推理