生成式人工智能应用发展报告(2024) ︶ 中国互联网络信息中心 工信洞察系列之 生成式人工智能应用发展报告︵ 2024 生成式人工智能应用发展报告(2024) 工信洞察系列之 地址:北京市丰台区汽车博物馆西路9号院4号楼邮编:100070 电话:(010)58813000 网址:http://www.cnnic.cn 邮箱:cnnic-survey@cnnic.cn 中国互联网络信息中心 中国互联网络信息中心2024年11月 工信洞察系列之 生成式人工智能应用发展报告(2024) 中国互联网络信息中心2024年11月 工信洞察系列报告编委会 编委会主任刘郁林 编委会副主任张晓 编委李强吕坚汪立东 编 写 组 王常青 郝丽阳 郭 悦 谢思娴 武志敏 生成式人工智能应用发展报告(2024) 前言 2024年是中华人民共和国成立75周年,是习近平总书记提出网络强国战略目标10周 年,也是我国全功能接入国际互联网30周年。党的十八大以来,以习近平同志为核心的党中央高瞻远瞩,立足党和国家事业发展全局,着眼经济社会长远发展需求,从信息化发展大势和国内国际大局出发,重视互联网、发展互联网、治理互联网,作出了加快建设网络强国的重大决策部署。我国信息领域关键核心技术加速突破,数字经济成为稳增长促转型的重要引擎,互联网深度融入居民消费、教育、医疗、养老等多个民生领域,亿万人民共享互联网发展成果。 作为新一轮科技革命和产业变革的重要驱动力量,人工智能将对全球经济社会发展和人类文明进步产生深远影响。习近平总书记指出,“中国高度重视人工智能发展,积极推动互联网、大数据、人工智能和实体经济深度融合,培育壮大智能产业,加快发展新质生产力,为高质量发展提供新动能。”长期以来,我国高度重视人工智能技术、产业发展治理,出台 《生成式人工智能服务管理暂行办法》《国家人工智能产业综合标准化体系建设指南》《人工智能安全治理框架》等一系列政策文件,为包括生成式人工智能在内的人工智能技术、产业健康有序发展奠定了坚实的制度基础,推动相关领域实现高质量发展。 在此背景下,中心组织编写《生成式人工智能应用发展报告》(以下简称《报告》),基于“发展历程-政策环境-技术生态-应用探索”的分析框架,对生成式人工智能的产业发展情况、投融资情况、用户使用情况进行研究分析,展现社会各界对新兴技术的探索实践,力图为政府部门、国内外行业机构、专家学者和广大人民群众了解我国生成式人工智能的发展现状提供参考。 感谢各参与机构对《报告》研究工作的支持,希望广大读者提出宝贵的意见建议,帮助我们不断提升重点问题研究能力,形成更多具有前瞻性、战略性的研究成果。 工信洞察系列报告编委会 2024年11月 生成式人工智能应用发展报告(2024) 目录 第一章生成式人工智能发展综述1 一、生成式人工智能在创新探索中快速发展1 二、生成式人工智能产业持续拓展加速演进3 三、发达地区成为生成式人工智能产业领头羊4 四、良好融资环境为生成式人工智能插上翅膀5 第二章生成式人工智能政策环境9 一、国内政策:中央与地方政府积极引导,协同发力9 二、国际政策:欧美亚各国政策差异明显,各有所长12 第三章生成式人工智能技术生态15 一、体系化支撑促进大模型技术加速演进15 二、多模态大模型助力迈向通用人工智能17 三、智能体繁荣推动构建人工智能大生态19 第四章生成式人工智能应用情况21 一、用户端应用持续涌现,带来智能化便捷生活体验21 二、企业端应用日新月异,赋能千行百业智能化升级27 第五章生成式人工智能发展的难点与建议35 一、发展难点35 二、相关建议37 生成式人工智能应用发展报告(2024) I 第一章生成式人工智能发展综述 一、生成式人工智能在创新探索中快速发展 生成式人工智能(GenerativeArtificialIntelligence,简称GAI)1是基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的人工智能技术分支。 早在二十世纪50至90年代,研究人员就已经开始利用算法来模拟人类进行创作,比如利用隐马尔可夫模型、高斯混合模型、贝叶斯网络来生成语音或时间序列数据。但这些尝试受到当时计算能力和数据资源的限制,成果较为有限。人工智能技术在内容创作方面的发展也因此遇到了瓶颈。 进入二十一世纪,深度学习的出现给人工智能的内容生成能力带来了革命性变化。2014年,生成对抗网络的概念被提出,成为人工智能技术发展的重要里程碑,并在图像生成等多个领域取得了显著成果,为日后生成式人工智能的出现打下基础。随后,变分自编码器和扩散生成模型等技术进一步推动了图像生成技术的发展。此外,随着长短期记忆网络和Transformer等模型的出现,自然语言生成领域也取得了显著进展。 在AI生成内容的早期,不同领域,如自然语言处理(naturallanguageprocessing,NLP)和图像生成领域之间,没有太多的重叠。在NLP领域,最初是使用N-gram朴素语言模 型,学习单词分布,通过前一个字符来预测下一个字符。因为该模型记忆能力有限,所 参考材料:自然语言处理(NLP)模型发展历程2 2022年11月,OpenAI推出了ChatGPT以及后续一系列模型,使得生成式人工智能开始拥有特定的产品形态,并引起了全世界的关注。这类产品不但能够与用户进行自然语言交流,还能生成高质量的文本、音频、视频内容,执行翻译、摘要和问答等复杂任务,展现了十分广阔的应用前景。此后,全球各行各业开始投入对生成式人工智能的研究和应用探索。尤其在我国,百度、阿里巴巴、腾讯、华为等企业积极推动生成式人工智能技术的研发创新与应用落地,在经济发展、民生服务、科学发现等多个领域取得了积极成果。 1尽管生成式人工智能(GenerativeArtificialIntelligence)在日常生活中经常与大语言模型(LargeLanguageModels)被混淆使用,但二者在概念上存在一定差异。一般认为,大语言模型是生成式人工智能的一个特定类别,专注于自然语言处理。 2来源:车璐,张志强,周金佳,等.生成式人工智能的研究现状和发展趋势[J].科技导报,2024(12). 生成式人工智能应用发展报告(2024) 1 以无法生成超过一定长度的连贯文本。相比之下,基于神经网络语言模型能够生成较长的连贯文本。用于建模语言的第1类神经网络是循环神经网络(recurrentneuralnetworks,RNN),RNN逐个阅读单词,同时更新思维状态,使得该模型具备短期记忆。由于RNN存在着短期依赖瓶颈问题,长短期记忆网络(long-shorttermmemory,LSTM)被挖掘出来并用于长文本生成任务之中。在理论层面,LSTM可以实现长时间记忆。然而,在具体的实践中,经过几十到100个词后,该模型就开始偏离主题。为了解决这一问题,一种基于注意力机制的新型神经网络结构Transformer在2017年被提出,同时受到了广泛关注。该架构的并行化处理使其能够充分利用图形处理单元(graphicsprocessingunit,GPU)。此外,该结构在设计层面上允许不断地堆叠编码器或解码器结构,使得整个网络结构能够变得更为复杂,这为后续大语言模型的出现奠定了基础。 自2018年以来,基于Transformer架构,大语言模型开始逐步涌现,其中最著名的当属Google的来自Transformer的双向编码器表示(bidirectionalencoderrepresentationsfromtransformer,BERT)模型和OpenAI的生成式预训练(generativepre-training,GPT)系列模型,其包括OpenAI于2018年率先提出的GPT-1模型,约有1.2亿个参数。紧接着Google于2019年提出了BERT模型,约有3.4亿个参数,其整体性能优于GPT-1。随后,OpenAI迅速提出了GPT-2模型,拥有的参数量高达15亿,并在40GB的文本上进行了训练,实现了性能的进一步提升。之后,为实现更为优异的性能,OpenAI于2020年提出GPT-3模型,该模型具有1750亿个参数,其性能足以碾压之前的GPT-1、BERT和GPT-2模型。然而,由于缺乏有效的引导,GPT-3模型在生成文本内容时常常会出现一些不令人满意的结果。 为解决这一问题,OpenAI提出了InstructGPT模型,具体通过人类反馈强化学习 (reinforcementlearningfromhumanfeedback,RLHF)机制引导模型生成符合预期的内容结果。基于InstructGPT模型,OpenAI于2022年推出了ChatGPT,带来了AIGC面向大模型时代的浪潮。紧接着,OpenAI在2023年提出了GPT-4,其参数量高达到1.8万亿,整体性能令人惊叹。这些模型擅长文本理解,在文本分类、实体检测和问题回答等能力上具有卓越的表现。同时,其他新兴的大模型如Sora,也为AIGC领域带来了新的视角,Sora模型通过其独特的架构和进阶的多模态处理能力,进一步拓宽了自然语言处理的应用范围。2024年,一些新的突破性研究工作进一步推动了NLP领域的发展。 生成式人工智能应用发展报告(2024) 2 图NLP模型发展历程 二、生成式人工智能产业持续拓展加速演进 人工智能相关产业的发展在我国一直备受关注。早在2017年国务院印发的《新一代人 工智能发展规划》就提出,“到2025年,人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为我国产业升级和经济转型的主要动力,智能社会建设取得积极进展”3。尤其自生成式人工智能问世以来,大型互联网厂商、中小型初创企业纷纷投入对此类产品和技术的研发,推动我国相关产业发展水平持续进步。 产业规模方面,我国人工智能产业体系更加全面。我国对人工智能技术发展一直予以 高度关注,尤其自2023年生成式人工智能概念兴起至今,国产生成式人工智能大模型如雨后春笋般涌现。截至目前,我国已初步构建了较为全面的人工智能产业体系,相关企业超过4500家,核心产业规模已接近6000亿元人民币,产业链覆盖芯片、算法、数据、平台、应用等上下游关键环节4。 产品数量方面,生成式人工智能产品在我国百花齐放。截至2024年7月,我国完成备 案并上线、能为公众提供服务的生成式人工智能服务大模型已达190多个5,我国以大模型为代表的人工智能普及率达16.4%6。百度的文心大模型、阿里的通义大模型、腾讯的混元大模型、字节跳动的豆包大模型、华为的盘古大模型、月之暗面的“Kimi智能助手”等生成式人工智能产品纷纷上线,为用户提供了丰富的选择空间和差异化的用户体验。 产业融合方面,生成式人工智能与各行各业的融合正在我国加速落地。生成式人工智 能与制造业、农业、医疗、教育等传统行业深度融合,推动产业转型升级,促进新业态、新模式的不断涌现。尤其在2024年,随着生成式人工智能技术的日趋成熟,各大科技企业的 3来源:中国政府网,https://www.gov.cn/xinwen/2017-07/20/content_5212064.htm,2017年7月20日。 4来源:环球网,https://3w.huanqiu.com/a/53309b/4KKnBYYjkLC,2024年11月20日。 5来源:新华网,http://www.xinhuanet.com/tech/20240814/57ef02dfa313413980511429a8252469/c.html,2024 年8月14日。 6来源:《第54次中国互联网络发展状况统计报告》。本数据调查了生成式人工智能产品的用户使用情况,包括ChatGPT、文心一言、通义千问等。 生成式人工智能应用发展报告(2024) 3 模型调用价格显著下降7,从而明显降低了其他行业对生成式人工智能技术的应用成本。从智能语音助手到