现象级AI产品ChatGPT分析及建议 中国联通研究院 ChatGPT概念及成功要素 ChatGPT产品说明:非常贴近人类的对话习惯和价值观的对话机器人模型 1 ChatGPT成功要素:长期技术积累+海量数据+巨量算力+先进模型架构ChatGPT=文本生成(一种AIGC[1]场景)+大模型技术 大模型技术是实现AIGC的必要技术基础,AIGC是大模型落地的典型应用场景 ChatGPT背后的AI技术正在加速数字时代内容生产力的深刻变革 AIGC市场分析 AIGC开拓了基于数字技术的内容生态新赛道,将重塑数字内容内容产业链 2 AIGC赛道广阔,但运营商需冷静判断分析,找到实现商业正循环的落地场景大模型市场分析 ChatGPT为代表的大规模预训练模型有望成为AI时代的“新车轮”,是“智能+”的基础生产工具 大模型及其ChatGPT产品将对国家的技术主权、文化主权、数据主权产生巨大和复杂的影响 大模型带来的系统性挑战 技术发展催生海量算力需求,AI产品服务和商业生态将会重塑 3 科技博弈带来的挑战:系统性研究滞后、芯片短缺、可用数据不足应对大模型挑战的建议 -2- 产业政策支持,推动国家重大工程载体建设,完善产业生态,推动跨界融合,释放群体智力 推动行业数字基础设施协同,为算力网络提供重要检验标准,为智原生网络提供先导性场景 [1]AIGC:AIGeneratedContent,人工智能生成内容 -3- 1 ChatGPT介绍及技术分析 2 ChatGPT相关产业价值分析 3 系统性挑战及应对建议 2022年11月30日,OpenAI公司发布语言模型ChatGPT,模型采用对话形式与人进行交互,且非常贴近人类对话习惯和价值观。 信息检索 代码编写 ChatGPT应用功能包含日常对话、专业问题回答、信息检索、内容续写、文学创作、生成代码、调试代码等能力,展现了在文本领域迄今为止最为强大的AIGC能力。 逻辑计算 -4- ChatGPT发布后5天用户已超百万,目前月活跃用户估计已达1亿,成为历史上增长最快的消费应用。 多轮对话 文艺创作 -5- 特斯拉 车载终端主机问答系统 Twitter 社交网络虚拟NPC PayPal 在线客服 Bing 新一代搜索引擎 Office 高级文本内容生成 Azure 通用性云服务 小冰(已从微软独立) 数字人语言、文本交互内核 潜在应用场景 创始人 2015年成立OpenAI主要目标: 制造“通用”机器人和使用自然语言的聊天机器人 马斯克 太空探索技术公司(SpaceX)CEO兼CTO特斯拉(TESLA)公司CEO 彼得·蒂尔PayPal联合创始人 阿尔特曼 主要投资方 美国创业孵化器YCombinator总裁 2019年7月22日,微软投资OpenAI10亿美元,2020获得GPT-3(ChatGPT前身)独家授权,近期已追加百亿美元投资 -6- 将继续加大对AIGC技术的研发投入,已于3月推出与OpenAI的ChatGPT类似的人工智能聊天机器人“文心一言”。 向OpenAI(ChatGPT母公司)追加数十亿美元投资,将ChatGPT集成到新版Bing搜索引擎和Edge浏览器中,同时在Azure云服务整合ChatGPT技术,让Azure能够带来更丰富的人工智能互动内容。 袁进辉(OneFlow深度学习框架创始人):ChatGPT的技术进步,可比作首次“登月”,这样的进步令行业感到震惊。 信通院&AIIA: 语义理解较准,尚难以摆脱知识整合和逻辑困境。(ChatGPT模型评测) 将ChatGPT视为“红色警报”,看作对搜索引擎的颠覆式挑战,正加紧研发测试ChatGPT竞品“Bard”,并已开展内测工作。 埃隆·马斯克: ChatGPT惊人的好,我们离危险且强大的人工智能不远了。 YannLeCun(2018图灵奖得主): 就底层技术而言,ChatGPT并不是多么了不得的创新。 GPT:只有简单的单向语言模型任务 GPT-2:使用更多的数据,更大的模型,新增了更多辅助训练任务 GPT-3:使用45TB的超大规模数据训练,在有3000亿单词的语料上预训练拥有1750亿参数的模型;具备语言生成、上下文学习、常识知识问答等三方面重要的能力 InstructGPT:加入基于人工反馈的强化学习,即RLHF( ReinforcementLearningfromHumanFeedback) ChatGPT:源自GPT-3.5模型,基于人类反馈的强化学习的指令微调(Instructiontuning)技术,使其更加遵循人类价值观,且可实现包含更多细节的生成,具备建模多轮对话的能力 -7- ChatGPT的成功不是一蹴而就,经过了多轮技术迭代演进 海量数据+巨量算力+先进模型架构ChatGPT 数据 文本生成 图像生成 AIGC场景 海量数据 算法 大模型 大模型 AI技术 大参数算法 AI模型 ChatGPT 对话机器人 Dall·E2 图像生成工具 OpenAI产品 大模型 -8- 大模型是实现AIGC的必要技术基础,AIGC是大模型落地的典型应用场景 -9- -10- -11- 1 ChatGPT介绍及技术分析 2 ChatGPT相关产业价值分析 3 系统性挑战及应对建议 -12- AIGC市场包括生成式AI模型及从底层基础设施到海量用户应用的全产业链。 AIGC开拓了基于数字技术(包括云、网、算、AI、区块链在内)的内容生态新赛道,必将重塑内容产业链。 内容创作市场正处于UGC[2]向AIGC转变阶段,初期AIGC多用于面向娱乐媒体内容的辅助生产,后续随着云、网、算、 智等技术融合及生态完善,AIGC将重塑垂直行业的内容生产模式。 [2]UGC:UserGeneratedContent,用户生成内容 -13- 在医疗领域,为失声者合成语言音 频,为残疾人合成肢体投影、为心理疾病患者合成医护陪伴 根据课本制作历史人物形象、将2D 课本转换为3D,丰富教育教学模式 -14- 提高生产力 大模型凭借优秀的数据价值挖掘能力和较高的应用智能化水平,可完成大部分工业生产工作,极大提升社会生产力与劳动效率。 改善决策 大模型可以通过提供大量的数据分析来帮助改善决策,解决实际的生产科研决策需求,辅助发现新的创意和解决问题的办法。 改善社会福祉 大模型基于海量数据,使用统一模型架构解决各类AI任务,显著提升AI模型的通用性及泛化性,将提高各行业的服务质量,改善生活水平。 在工业设计中根据任务要求,智能化调整机器的力度和速度,完成生产线上的精细加工 实现新闻传媒资讯、产品介绍视频内容的自动化生产 在药物研发过程中,实现蛋白质结构三维模型的精确预测 针对用户的英文提问搜索中文信息源,并提供相关辅助攻略,实现跨语言多模态信息检索 -15- AI技术已在教育、安全、金融、交通、医疗健康、家居等领域实现规模应用,其应用场景也愈来愈丰富,极大方便了人们的生活。 大力发展以大模型为基础的AI技术,就是坚持科技以人为本,能够提升人的生活品质,让人的生活更美好。 面向人民生命健康 语言类大模型作为重要媒介,其广泛传播将对舆论和意识形态产生巨大影响。 语言类大模型是数字时代文化和价值观生长的土壤。若无法自主掌控,将极大影响本国文化和价值关安全,失去文化和价值观话语权。信息安全问题也将更为突出。 以大模型为基础的AI技术将是未来经济增长的关键推动力。未来十年,人工智能将助推全球生产总值增长12%左右。同时,将催生数个千亿美元甚至万亿美元规模的产业。 掌握大模型原创技术可以为经济高质量发展提供强大的科技支撑。 习近平总书记在主持召开科学家座谈会时提出,希望广大科学家和科技工作者肩负起历史责任,坚持面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,不断向科学技术广度和深度进军。 通用大模型是通用AI的基石,是AI时代的“软芯片”,是未来AI应用的主要生产工具。 掌握大模型原创技术将为我国AI创新发展提供技术底座,抢占科技创新制高点。反之如果大量AI应用基于国外大模型研发,一旦断供,将犹如芯片被“卡脖子”。 面向世界科技前沿 面向经济主战场 面向国家重大需求 -16- 1 ChatGPT介绍及技术分析 2 ChatGPT相关产业价值分析 3 系统性挑战及应对建议 以ChatGPT为代表的AI应用驱动算力需求指数级增长,算力成为各国抢占发展主导权的重要手段,是支撑数字经济发展的坚实基础。 Teraflop/s-days107 105 模型浮点计算量 103 目前我国算力基础设施建设仍存在资源总量不足、布局发展不均、先进计算芯片进口受限等问题。 101 10-1 L1:算力需求每24个月翻倍 L2:算力需求每3.4个月翻倍 L2L3 GPT-3 GPT-2 BERT L3:算力需求每2个月翻倍 传统模型 深度学习模型 基于全新架构的大模型 云网融合、算网一体等算网技术为解决算力资源的调度与编排提供了全新的基础设施保障方案。 10-3 10-5 10-7 (符合摩尔定律) L1 深度学习时代 -17- 19801990200020102020 算力需求加速增长趋势图 建议国家层面的应对举措 相关产业政策支持: 提高战略定位,将大模型视作“东数 西算”式基础设施建设; 国家任务牵引,以国家重大工程为载体,推进国家大模型构建; 人才环境配套,人才內育外引,建设 完善大模型科学装置。大模型产业生态完善: 挖掘需求,应用牵引,推动大模型产 业发展联盟成立,旨在挖掘各垂直行业需求场景推动大模型应用落地; 跨界融合,开放共赢,凝聚产学研各 界力量合作研发。 -18- 多方原因致使国内大模型研究滞后 国内目前没有ChatGPT量级大模型问世,主要发展瓶颈在于: 技术积累匮乏。大模型技术架构、大模型训练框架等相关技术长期依赖国外,国内原创技术生态仍需建设。 数据质量不足。各行业企业缺乏对高价值数据的有效感知,高质量 数据积累及流通性不足。 创新环境需完善。整体商业、政策环境较为急躁,对长周期的投入与产出容忍度较低。 中美摩擦为未来研究埋下隐患 大规模预训练模型对算力要求极高,目前该市场国外厂商占有率极高,国内芯片无论是数量、质量、生态建设上都有所欠缺。而美国针对中国 高端计算卡(如NVIDIAA100等)禁用,导致了未来国内训练更大规模 预训练模型缺乏算力支持。 数字产品 ChatGPT完成了数字时代“文本”对话类服务的范式升级,未来随着图片、音频、视频等多模态大模型出现,AI创作引擎将成为未来数字内容的主要生产源头。 -19- 供应链 资源匮乏,聚少成多。单厂商单IDC无法实现,组成联合组织跨云(IDC)实现。跨域训练对网络带宽、时延要求极高,是运营商机遇之一; 国产芯片,加速替代。国产AI芯片生态薄弱,未 能形成研发-生产正反馈。头部云公司规模庞大,替换国产芯片成本巨大,而运营商云服务增长空间巨大,可结合新场景进行芯片国产化替代。 算力网络 算力网络重要场景。由于ChatGPT类大模型服务需 要不断迭代,其周期性、常态化的增量学习(训练)需大量算力及数据传输,是未来算力网络重要收入增长点; 模型西训,服务东用。在“东数西算”格局下,未来必然形成“西训东用”的大模型服务模式,训练 后的模型向东部提供应用服务、实现数据流转,依赖分级算力网络的支持。 智原生网络 网络的内生智能是未来6G网络实现完全自智的基 础,内生大模型将有望推动网络自智能力加速走 向L5级别。 立足新三者 公司战略决策的参谋者、公司科技创新的引领者、公司产业发展