您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[亿欧智库]:2023中国AIGC商业潜力研究报告 - 发现报告
当前位置:首页/行业研究/报告详情/

2023中国AIGC商业潜力研究报告

信息技术2023-07-01亿欧智库机构上传
2023中国AIGC商业潜力研究报告

©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 2023中国AIGC商业潜力研究报告 ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 亿欧智库https://www.iyiou.com/researchCopyrightreservedtoEOIntelligence,July2023 利润潜力 ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 前言 ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 在人工智能发展的漫长历程中,如何让机器学会创作一直被视为难以逾越的天堑,“创造力”也因此被视为人类与机器最本质的区别之一。然而,人类的创造力也终将赋予机器创造力,把世界送入智能创作的新时代。从机器学习到智能创造,从PGC,UGC到AIGC,我们即将见证一场深刻的生产力变革,而这份变革也会影响到我们工作与生活的方方面面。 01-导览 原因1 原因2 原因3 中外差距 中国生成式AI与国外先进水平存在一定差距,但凭借国内应用场景的多样性,具备AIGC的数据积累优势,有望追上先进步伐。 多模态打破多种信息之间的边界,提升AIGC内容多样性与技术多样性,拓宽应用的场景。 AI跨入生成式阶段 基于大模型的泛化能力,知识蒸馏与微调后进入专用领域的应用,覆盖短头、长尾的场景。 预学习引发AI技术质变,摆脱过去AI的高门槛、训练成本高、生成内容单一的痛点。 03-导览 亿欧智库:AIGC原子能力商业潜力评估模型 规 文本 亿欧智库:基础原子能力潜力指数 1.87 模潜力 亿欧智库:多模态原子能力潜力指数 聊天机器人0.25 图像 1.17 虚拟人 0.22 音频 基础原子能力 0.76 合成数据 0.20 视频 0.69 泛化与通用场景 专业场景 AIGS 0.18 代码 0.51 知识图谱 0.16 多模态原子能力 本报告将向所有关注未来科技的相关机构、从业者、创业者、投资人传递亿欧对AIGC的市场潜力场景的洞察和优秀企业案例。 技术可行性边界 基础设施边界 认知谬误边界 经济价值边界 04-导览 亿欧智库:AIGC商业潜力边界模型 2030年中国AIGC市场规模将接近万亿 02-导览 数据成本为大模型成本23% 数据为大模型能力的上限 算法成本为大模型成本12% 高质量的算法使大模型能力贴近上限 算力为大模型能力的下限 算力成本为大模型成本65% 短期内,扩大算力是AIGC的刚需。 FPGA及ASIC有望在远期成为主力AI芯片。 AIGC大模型生态圈解析 目前大模型以服务B端为主,其中平台服务模式的占比相对较高 为防止中国大模型出现“数据马太效应”,大模型亟需高质量的标注数据进行训练,提高生成能力。 ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 2 目录 CONTENTS ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 01 AIGC概述 ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 1.1人工智能概念梳理 1.2生成式人工智能因素分析 1.3中外人工智能对比 1.4AIGC原子能力变化 02 AIGC生态底座价值链分析 2.1AIGC生态底座价值拆解 2.3数据价值分析 2.2算力价值分析 2.5AIGC生态服务商总结 2.4算法价值分析 ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 2.6大模型生态底座产业图谱 03 AIGC原子能力商业潜力分析 3.1AIGC原子能力覆盖行业梳理 3.2AIGC基础模态原子能力分析 3.3AIGC多模态原子能力分析 3.4AIGC原子能力商业潜力评估总结 3.5原子能力产业图谱 3.6优秀企业案例 04 AIGC商业潜力规模预判 目录 CONTENTS ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 01AIGC概述 1.1人工智能概念梳理 1.2生成式人工智能因素分析 1.3中外人工智能对比 1.4AIGC原子能力变化 02 ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) AIGC生态底座价值链分析 2.1AIGC生态底座价值拆解 2.3数据价值分析 2.2算力价值分析 2.5AIGC生态服务商总结 2.4算法价值分析 ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 2.6大模型生态底座产业图谱 03 AIGC原子能力商业潜力分析 3.1AIGC原子能力覆盖行业梳理 3.2AIGC基础模态原子能力分析 3.3AIGC多模态原子能力分析 3.4AIGC原子能力商业潜力评估总结 3.5原子能力产业图谱 3.6优秀企业案例 04 AIGC商业潜力规模预判 ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) AIGC(AIGeneratedContent)是基于GAN、预训练大模型、多模态技术融合的产物,通过已有的数据寻找规律,并通过泛化能力形成相关内容。从商业角度看,AIGC是一种赋能技术,通过高质量、高自由度、低门槛的生成方式为内容相关场景及生产者进行服务。 早期决策式AI依赖逻辑判断的纯粹性,万物都能完美观察、任何测量不存在误差的前提不符合真实世界的“不确定性”;概率范式基于经验主义与理性主义一定程度上解决了“不确定性”;深度加强学习可以利用合理的数据丰度与奖惩模型达到类人类智能的水平,实现高质量内容与内容创作自动化;通用型AI具备泛人类智能,可以像人类一样执行各种任务。 决策式AI 生成式AI 通用型AI ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 综合能力 AI在早期工作在于关注逻辑、自动定理证明和操纵各种符号,该类AI理解基础的物理知识,具备一定的逻辑能力,通过分析数据和信息,帮助使用者更好的做出判断与决 概率与统计可以初步解决“不确定性”,但是概率范式需要经验主义先于理性主义进行填充。以Bayes模型为例,需要经验主义者先设定先验数据。 以数据为中心,深层次的网络堆叠为架构,样本数据及数据种类的丰富,训练的模型泛化能力就越强,效果越好。同时深度学习训练的AI已经可以很好的执行任务。不过,强化学习的效果却不一定受到数据丰度的影响。强化学习遵循Markov原则,只要奖惩设计合理就能实现不错的效果。 具备泛人类智能的AI,可以像人类一样执行各种任务。 自迭代能力 策。但基于逻辑的AI缺乏感知能力,对真实世界普遍存在的“不确定性”较难处理。 Markov奖惩模型: 伦理道德 智能体 奖励行动 环境 目前位置 协作能力 状态 执行能力感知能力学习能力决策能力认知能力 AI ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 1.0逻辑范式2.0概率范式3.0深度学习范式3.0+深度强化学习范式4.0??范式 资料来源:卡内基梅隆大学、朱松纯《浅谈人工智能:现状、任务、架构与统一》、公开资料、亿欧智库整理 AI范式 5 ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 在1956年的达特茅斯会议上,“人工智能”的概念被首次提出,六十多年以来,历经逻辑推理、专家系统、深度学习等技术的发展,人工智能也经历了数次沉浮,有如日中天的发展时期,也有因技术不足热度退去后的寒潮。而每一次寒潮后,也会经历技术的蛰伏发展,为人工智能带来里程碑式的进步。 1970年代第1次寒潮 当时主要研究集中在逻辑抽象、逻辑运算和逻辑表达等方面,出现许多逻辑证明相关的逻辑程序语言,如著名的Prolog。 ©亿欧智库-李先生(203972) 但是当时研发出来的人工智能系统缺乏实用性,几乎无法解决任何实际问题,无法达到人们期望,政府逐步减少投资,高潮衰落,进入第一次寒冬。 亿欧智库:AI发展的2.5次寒潮 1990年代第2次寒潮 出现神经系统与专家网络。神经系统在解决复杂问题上能力不足,且训练时需要的数据量较大。专家系统的实用性只局限于特定领域,同时升级难度和维护成本都居高不下。 ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 日本推出第五代计算机计划——抛弃冯诺依曼架构,采用新的并行架构,采用新的存储器,新的编程语言,以及能处理自然语言、图像的新操作方式,但局限于理论和计算机算力,以及知识完全依靠人工输入和维护,最终宣告项目失败。 2010年代第2.5次寒潮 存在计算能力不足的瓶颈,以深度学习为驱动力的人工智能技术更多仍停在分类、聚类和预测阶段,能够完全复制人类思维方式的强人工智能依旧发展缓慢。 互联网公司对AI的开发便捷程度与先进程度超过许多AI公司,因为互联网可以使用自己的不公开的内部数据进行训练。 Hopfield神经网络 亿欧智库:AI技术发展里程碑 深度学习 ChatGPT 一种具有循环、递归特性,结合存储和二元系统的神经网络 提供了模拟人类记忆的模型 在机器学习、联想记忆、模式识别、优化计算等方面有着广泛应用 弥补了传统BP神经网络的缺陷,利于可视化和分类,识别精度上升,训练难度下降 无需人工提取规则特征,机器通过海量数据,即可自动实现规则的特征提取,有机出现 器本身完成最复杂的算法归纳 感知器 ©亿欧智库-李先生(203972) 神经网络的第一个里程碑算法 可以解决简单的线性分类问题 为后期更复杂的算法奠定基础 多层前向BP网络 ©亿欧智库-李先生(203972) 非线性映射能力:适合于求解内部机制复杂的问题 自学习和自适应能力:训练时能自适应的将学习内容记忆于网络的权值中 容错能力:局部神经元受到破坏后对全局的训练结果不会造成很大的影响 芯片&服务器&数据 ©亿欧智库-李先生(203972) 计算机硬件设施飞速发展,GPU、TPU等新一代芯片及FPGA异构计算服务器,提供强大算力 互联网、物联网发展迅猛,为人工智能提供了规模空前的训练数据,数据可获得性大幅提升 ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) ©亿欧智库-李先生(203972) 预学习的出现解决了过去生成式大模型的痛点,但预学习本身存在模型尺寸、小样本数量、微调能力的不可能三角,解决方法也不尽相同:对于极大模型,使用知识蒸馏;对于少样本学习能力,进行数据增强;对于监督训练表现欠佳的模型,进行提示学习。 以GPT为例,在目前阶段,厂商通常的做法是扩大模型尺寸。 亿欧智库:预学习大模型引发AIGC技术质变 预学习大模型的出现解决了过去各类生成式模型使用门槛高、训练成本高、内容生成简单和质量偏低的痛点,满足真实内容消费场景中的灵活多变、高精度、高质量等需求。 微调 预学习思路: •将大量低成本收集的训练数据集中,学习其中的共性 •然后将其中的共性移植到特定任务的模型中,再 进行微调,去学习该特定任务的特性部分 特性学习 共性学习 特定任务 训练任务 •知识蒸馏 •大模型是网络的集合,拥有良好的性能和泛化能力,小