海外AI应用梳理:模型能力决定下限,场景适配度决定上限 开、闭源模型共存满足不同开发需求,多模态有望催生现象级应用。大语言模型方面,闭源模型是模型基础能力上限持续突破的主阵地,同时通过开放API的方式实现能力延展。此外,开源与闭源模型差距缩小,并通过微调进一步助推应用生态繁荣。多模态方面,在头部AI公司及细分赛道领先者的共同推动下,图像、音视频生成等多模态愈发成熟。此外,集成文本、语音等混合多模态模型推出,变革人机交互方式,有望在强交互性场景中催生现象级应用。 海外文本编辑类应用表现亮眼,国内有望复制海外发展路径。从4月全球访问量前100网页版AI应用来看,可分为基于大语言模型的文本编辑类和代码编程类应用,以及基于多模态模型的图像类和音视频/游戏类应用,共四大类。其中文本编辑类因为基础模型能力技术较为成熟,因此应用最成熟:数量占比达58%,单月访问量过亿的8个应用中占7个。此外,现阶段海内外应用仍存在较大差距:海外前十AI应用单月访问量总和为55亿,而国内为1.2亿,头部产品ChatGPT单月访问量为18.6亿,国内Kimi为2004万。但从过去3个月来看,海内外前十应用的总访问量差距正逐步缩小。 子行业评级 游戏出版看好看好影视看好 相关研究报告 模型能力决定应用体量的下限,场景适配度决定上限。文本编辑类:海外访问量最高的是聊天机器人,其次是搜索引擎。因模型能力与场景适配度高,虚拟角色和教育应用体量上限较高:前者因容错率高有望随模型能力提升实现线性增长,而后者因容错率低需要模型出现较大迭代后方能实现体量突破。图像类应用:多数应用集成了图像生成和编辑功能,未来有望通过加深与B端场景融合实现规模增长。音视频/游戏类:全球视频和游戏市场规模均超1万亿元,场景天花板高同时AI适配度高。但因受限于多模态模型能力,目前尚未有过亿的应用。未来在AI深度赋能行业创作工作流的同时,AI+UGC视频和UGC游戏将是C端现象级应用的重要方向。 《继续关注AI应用起量和多模态技术演进两条主线》 《Sora横空出世,关注内容资产价值重估下的两条投资主线》 证券分析师:郑磊 E-Mail:zhenglei@tpyzq.com执业资格证书编码:S1190523060001 ◼投资建议 海外访问量最高的是聊天机器人,其次是搜索引擎。因模型能力与场景适配度高,虚拟角色和教育应用体量上限较高。音视频/游戏类场景天花板高同时AI适配度高,未来在AI深度赋能行业创作工作流的同时,AI+UGC视频和UGC游戏将是该类应用的重要方向。目前海内外应用仍存在较大差距:海外前十AI应用单月访问量总和为 55亿,而国内为1.2亿。但从过去3个月的访问量来看,前十应用的总访问量差距正逐步缩小。看好未来国内应用快速增长的趋势,并有望复制海外应用发展路径,最先在文本编辑类应用中取得突破。其中,聊天机器人、搜索引擎、虚拟角色应用有望最先实现访问量的大幅增长。 ◼风险提示 AI技术发展不及预期的风险、政策监管风险、行业竞争加剧的风险。 目录 1.模型层:大语言模型加深场景结合,多模态持续迭代............................5 1.1大语言模型:开、闭源共存以满足不同应用开发需求............................61.2多模态模型:技术持续演进,混合多模态有望催生现象级应用....................9 2.应用层:文本编辑类最成熟,国内有望复制海外路径...........................11 2.1应用分类:文本编辑类数量最多、访问量最高.................................112.2海内外应用对比:整体差距较大,国内有望复制海外发展路径...................14 3.海外应用梳理:模型能力决定体量下限,场景适配度决定上限...................16 3.1文本编辑类应用:聊天机器人最成熟,虚拟角色和教育潜力最大.................173.2图像类应用:编辑强于生成,加深与B端场景融合方能实现增长.................253.3音视频/游戏类应用:场景上限最高,模型能力仍处探索期......................27 4.投资建议................................................................29 图表目录 图1:AI大模型发展历程........................................................5图2:AI产业“基础设施+模型+应用”三层级......................................6图3:开源和闭源模型的发展历程................................................6图4:闭源和开源模型在基准测试中的得分对比....................................7图5:OPENAI大模型API的发布及更新情况.......................................7图6:OPENAI模型API的价格...................................................8图7:开源和闭源模型在五样本MMLU语言理解基准测试中的得分对比.................9图8:多模态模型的发展历程...................................................10图9:OPENAIGPT-4O演示......................................................11图10:谷歌PROJECTASTRA演示..................................................11图11:按生成内容形式划分全球访问量前100的网页版AI应用.....................12图12:AIGC技术的成熟应用进程时间表..........................................13图13:4月全球访问量前100的各类AI应用占比(%)...............................13图14:4月全球访问量前100的各类AI应用访问量(万)............................13图15:4月海内外前十AI产品访问量总和(万)对比...............................14图16:4月海内外首位AI产品访问量总和(万)对比...............................14图17:2024年2-4月海内外访问量前十的AI产品访问量总和(万)对比.............15图18:进入4月全球访问量增速前50的国内AI应用..............................15图19:4月访问量及增速表现亮眼的国内AI应用..................................16图20:4月全球访问量超千万的海外AI应用的细分类目............................16图21:文本编辑类访问量超千万应用的访问量总和(亿)..........................17图22:聊天机器人应用........................................................17图23:搜索引擎应用..........................................................18图24:虚拟角色应用..........................................................19图25:4月全球人均使用时长前30中的虚拟角色应用..............................19图26:翻译工具应用..........................................................20图27:写作工具应用..........................................................20图28:内容检测应用..........................................................21图29:生产力应用............................................................22图30:教育应用..............................................................23图31:电商购物应用..........................................................23图32:营销工具应用..........................................................24图33:图像生成&编辑应用.....................................................25图34:PPT工具应用...........................................................26图35:音频生成应用..........................................................27图36:视频编辑应用..........................................................28图37:游戏生成应用..........................................................29 1.模型层:大语言模型加深场景结合,多模态持续迭代 谷歌BERT开启大模型时代,ChatGPT推升发展热潮。1956年,达特茅斯研讨会正式提出人工智能,标志着人工智能学科诞生。此后60余年,专家系统、深度学习等关键技术不断成熟,为大模型发展奠定基础。回顾大模型发展历程,可分为以下三个阶段:1)大模型开端:2018年,谷歌发布3亿参数规模的自然语言处理模型BERT,标志着人工智能正式进入大模型时代。2)大模型探索:2020年,GPT-3发布,模型参数规模大幅提升至1750亿。随后,谷歌、微软和英伟达相继推出自然语言理解或生成模型,对大模型技术的探索持续推进。3)大模型热潮:2022年底,基于迭代后的GPT-3.5模型构建的ChatGPT发布,引起市场广泛关注,AI迎来新一轮发展热潮。此后,OpenAI的GPT-4、谷歌的Gemini 1.5 Pro、Anthropic的Claude 3相继推出,不断提高大模型能力边界。 模型层持续迭代,带动下游应用层发展。类比于软件行业,基于服务器、操作系统等硬件和系统,开发针对不同下游场景的软件,AI产业可分为以下三个层级:1)基础设施层:由计算硬件GPU和TPU、为AI计算提供专用算力的智算平台、以及各类AI工具,如模型微调、数据标注等组成,三者共同构成了AI上层建筑的底层设施;2)模型层:依托于大量训练数据、算力资源构建的AI模型层由闭源模型和开源模型组成。两者相辅相成,共同推动AI应用发展;3)应用层:AI时代的应用基于底层大模型构建。根据大模型的不同,应用层可分为基于第三方模型构建的应用和基于自建大模型构建的垂直应用两大类。 资料来源:《生成式AI现状2023》,