行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

2023AIGC产业链北京市专精特新企业图谱

信息技术 2023-11-01 北京经信局玉苑金山

发现报告（www.fxbaogao.com）为您提供最专业的研报服务，用户量在业内名列前茅。我们收录的报告数量极多，覆盖了宏观、行业、公司等各个层面，几乎无所不包。平台设计极简，操作方便，利用前沿技术帮您快速筛选核心信息。大家都在用发现报告，因为这里能真正帮您高效解决问题，实现深度的市场洞察和决策。

北京SME北京市经济和信息化局北京市中小企业服务中心AIGC产业链北京专精特新企业图谱北京股权交易中心Beijing Equity Trading Center新京报贝壳财经

AIGC行业概况

历史里程碑：2022年11月30日，OpenAI推出的对话式通用人工智能工具ChatGPT，以其迅速增长的用户基数（5天内100万活跃用户，2个月内1亿活跃用户）成为历史上用户数量增长最快的消费者应用程序。
定义与特点：AIGC（AI Generated Content）指的是由生成式人工智能生成的文字、图像、音视频等内容，这类内容基于指令生成，旨在满足特定需求或场景。
市场规模：预计到2030年，中国AIGC行业市场规模将达到1.15万亿元人民币，年复合增长率高达23.1%。
政策支持：北京市政府出台多项政策文件，如《北京市促进通用人工智能产业发展若干措施》、《北京市关于更好发挥数据要素作用进一步激发全社会创新活力的意见》等，支持AIGC行业的发展。

专精特新企业概览

定义与特征：专精特新企业专注于细分市场，具备专业化、精细化、特色化和新颖化的特征，提供高质量、高性价比的产品和服务，利用人工智能技术提升竞争力。
技术创新：通过技术创新、管理创新和商业模式创新，形成新的竞争优势。
规模与分布：截至2023年，北京市共有2200家人工智能企业，其中618家为专精特新企业，数量在全国领先。

AIGC产业链结构

分层结构：包括应用层、数据层、模型层、算力层，分别负责应用开发、数据支持、模型训练和算力供应。
关键节点：数据层负责数据收集、清洗、标注；模型层利用Transformer等模型处理数据；算力层提供硬件支持。

北京市专精特新企业情况

数量与分布：北京市共有28%的专精特新企业，共计618家，位列全国之首。
算力层：算力成本占AIGC产业链65%，数据与模型算法成本占35%。算力层存在明显短缺，预计未来五年智能算力需求年均复合增长率达47.5%。
AI芯片现状：AI芯片市场主要由美国企业主导，特别是英伟达。中国政府限制其向中国出口先进芯片，导致“卡脖子”问题。
代表性企业：摩尔线程、中科驭数、清微智能等企业在算力层深耕，拥有自主研发能力，致力于DPU、GPU等高性能计算芯片的研发。

数据层与模型层

数据服务市场规模：预计2025年将增长至101.1亿元人民币，年复合增长率21.5%。
代表性企业：如数据堂晴数智慧、STARDUST海天瑞声等，提供高质量的数据服务，涵盖多语言、跨模态数据处理。
模型层：北京市拥有54个大模型，占全国总数的44%，企业如智谱·AI、润舟科技等在大模型开发方面表现出色。

应用层

应用领域：AIGC应用于图像生成、文字生成、跨模态生成、音频生成、策略生成和视频生成等多个领域。
代表性企业：如百炼智能、AiXcoder等企业探索AI大模型在编程、营销、智能编程、智能营销等领域的应用。

结论

北京市在AIGC产业链中展现出了强大的创新能力与产业聚集效应，特别是在专精特新企业、算力层、数据服务、大模型开发以及各应用层面上。政策支持与市场需求共同推动了该行业的发展，但同时也面临数据集短缺、AI芯片自主可控等问题，需持续关注技术创新与政策引导以促进健康可持续发展。

北京股权交易中心Beijing Equity Trading Center新京报贝壳财经 AIGC行业概况 2022年11月30日，OpenAI推出对话式通用人工智能工具ChatGPT，凭借其出色的语言理解、生成和知识推理能力在上线5天后活跃用户数就达到了100万，在2个月内活跃用户数达1个亿，成为历史上用户数量增长最快的消费者应用程序，受到各国政府、企业界、学术界的广泛关注，推动AGC行业迈出了开拓性的一步。什么是AIGC? 图：AI根据指令生成文字内容 0请为我介绍专精特新企业 AIGC(Al-GeneratedContent），生成式人工智能，指利用人工智能技术生成的数字内容包括文本、图像、音视频、代码等形式，属于人工智能技术催生的新兴行业。AIGC是基于自然语言处理、生成任务算法、预训练大模型多模态技术融合的前沿人工智能技术，通过数据训练寻找规律，利用泛化能力输出使用者需要的内容。专精特新企业是指具有"专业化、精细化、特色化、新额化"特征的中小企业。这些企业专注于某个产业链环节或产品，拥有高水平的专业化生产、服务和协作配套能力，为大企业和产业链提供零部件和配套产品及服，它们注重精细化生产，管理和服务，以高品质高性价比的产品和服务在组分市场中占据优势，同时，这些企业利用特色资源，弘扬传统技艺和地域文化，采用独特工艺、技术、配方或原料，研制生产具有地方或企业特色的产品。此外，专精特新企业还积极开展技术创新、管理创新和商业模式创新，培育新的增长点，形或新的竞争优势，专精特新企业是优质中小企业的基础力量，其中优秀的企业鼓称为专精特新小巨人"企业, 上势客力A生成，不代表开发者立场，事如需除或筛改本标证中国AIGC行业市场规模根据量子位智库测算，到2030年中国A/GC行业市场规模将达1.15万亿元。 LAIGC行业广受政策支持 2023.07 2023.07 2023.06 2023.05 2023.05 北京市委、市政府印发《关于更好发挥数据要素作用进一步加快发展数字经济的实施意见》国家7部门印发《生成式人工智能服务管理暂行办法》国家首个面向生成式人工智能行业的规范性政策开发ChatGPT具体步骤拆解 03.数据标注 04.模型开发 01.数据收集 02.数据清洗对数据进行标注，1以便训练模型时能够使用。例如，可以为每个单词标注词性、命名实体等收集大量自然语言文本数据如书籍、网络信息等。这些数据将用于训练ChatGPT的语言模型对收集到的数据进行清洗去除掉无用的信息设计ChatGPT的模型架构，包括编码器、解码器等。ChatGPT使用的是Transformer模型，是一种基于自注意力机制的深度神经网络模型 08.模型交互 07.数据评估 06.模型微调 05.模型预训练在大量文本数据上进行模型预训练，但没有特定的任务目标，目的是让模型学会理解语言的结构、语义和一些基本的知识。训练过程中需要使用大量的算力资源，如搭载GPU的AI服务器。训练时间长达几天基至几周微调的目的是使预训练模型适应特定任务，例如情感分析、机器翻译等。在微调期间，模型将一小部分标记好的训练数据（例如，带有情感标签的文本，源语言和目标语言的对应文本等）作为输入，并利用这些数据优化模型参数对训练好的模型进行评估检查其性能是否达到预期可以使用一些指标，如准确率、召回率等来评估模型的性能将训练好的模型部署到服务器上，以便用户可以与模型进行交互 LAIGC重点发展行业生物医药自然语言处理和计算机视觉自动驾驶金融行业通过模拟和预测药物分子的结构和性质，提高药物研发的效率和成功率。基于市场数据和经济指标，生成投资组合策略，优化风险和回报的平衡，提供金融投资意见，用于车辆感知、路径规划和驾驶决策等方面，提升自动驾驶车辆的安全性和行驶效率。用天文本生成！机器翻译，图像识别与生成、视频分析等方面。 AIGC产业链北京市专精特新企业情况 LAIGC产业链分层应用层包括各种使用AIGC技术的应用程序和产品，例如，聊天机器人、智能客服、智能证件照等，是AIGC行业的商业化落地途径模型层数据层 AIGC产业链的核心层级，例如用于自然语言处理和生成的Transformer模型，通过学习数据层中的数据知识，具备了理解和生成自然语言的能力，是实现AIGC功能的关键 AGC产业链的基础层级，包括用于训练和微调模型的各种文本、图片和音视频数据集为模型提供深度学习的“养料算力层为AIGC产业链提供底层硬件算力支撑，包括用于训练和部署模型的AI芯片、AI服务器等计算设备，使模型能快速训练和优化 28%占比618家北京人工智能企业全国人工智能企业算力层：价值占比最高算力占据AIGC产业链约65%的成本，数据及模型算法占据剩下35%的成本。根据浪潮预测，未来五年内，智能算力需求的年均复合增长率为47.5%，算力存在明显短缺情况。算力层：A芯片领域被“卡” AI芯片是算力硬件中的核心，价值占据算力成本的50%以上，目前以GPU为主。其中高算力GPU市场基本被美国英伟达公司断，而美国政府禁止英伟达向中国出口其尖端人工智能芯片，涉及A100、H100等型号，国产GPU在性能和良率方面存在较大的差距，因此我国AI芯片领域存在严重的“卡脖子”问题。【算力层：北京专精特新企业情况在AIGC行业的算力层，有14家北京市专精特新企业深耕领域，具有较强竞争实力，他们平均每家拥有发明专利16个，平均深耕行业8年以上，平均营业收入超1.8亿元。算力层：：有代表性的北京专精特新企业第能SOPHGO 清微智能TSING MICRO 中科取数Hnsnx 清微智能摩尔线程算能科技中科驭数由前英伟达全球副总裁张建中创立，国内为数不多能够覆盖GPU研发设计生产制造、市场销售、服务支持等完整流程的创业公司，并于2022年发布首颗国产全功能GPU，能够为AI大模型提供强大计算加速能力。国内领先的通用算力提供商，专注AI, RISC-V CPL等算力产品的研发和推广应用，为智算中心、智能制造、AIGC等应用场景提供算力产品及整体解决方案。国内DPU芯片领域唯一拥有自研核心架构能力的企业被评为中国信科潜在独角兽" 核心团队来自清华大学，公司专注于可重构计算（CGRA）芯片的研发和创新，为AI训练、推理，NLP自动驾驶，生物计算等通用计算场景提供高性能算力支持。 DPU是继CPUGPU之后，数据中心场景中的第三颗重要的算力芯片。自2016年以来旗下品牌算丰SOPHON系列产品已完成多次选代每代产品相较于前代产品均实现能耗比倍数级提升。中科驭数在芯片领域有近二十年的技术积累，至今已进行三代DPU芯片的研发选代。公司曾获国家技术发明奖、中国专利金奖、科学技术奖技术发明一等奖等多个奖项。截至目前，摩尔线程估值超150亿元，迈入独角兽行列。 “堵点”数据层：数据集环节存在斯坦福大学吴恩达教授提出二八定律：80%的数据+20%的模型=更好的Al 当前，主流数据集多以英文为主，中文数据集紧缺。根据360分析，中文语料数据集占比低于5%。此外，中文预料数据集质量差，数据集种类和内容缺乏多元化，专用领域数据集基本空白，在政府、医学、金融等公共领域的开源数据稀缺。对比之下，美国拥有大量的文本、目标检测数据集。因此，中国AIGC产业链的数据集环节存在“堵点”。【数据层：我国A数据服务市场规模持续扩容【数据层：北京专精特新企业情况在AIGC行业的数据服务领域，有11家北京市专精特新企业处于行业领先地位，平均研发强度超20%（研发投入/营业收入），营收增长率超30%，平均每家企业软件著作权数量超50个。数据层：有代表性的北京专精特新企业晴数智慧MAGiCDATA speechzcean海天瑞产晴数智慧数据堂星尘数据海天瑞声我国最早从事AI训练数据解决方案提供商之一，向全行业提供多语言、跨领域、跨模态的人工智能数据及相关数据服务，覆盖全球近200个主要语种及方言，2021年8月在科创板上市现拥有全球最大规模的AI版权数据库建立了以AI版权数据、AI数据生产工AI数据评测系统为主导产品的服务体系，覆盖了智能语音、生物认证无人驾驶、智能安防等领域3.5PB规模的版权数据库贝壳购在传统数据采集标注基础上，在数据生成、清洗、分类微调、测试等环节，提供专业的Daas( Dataas aService）解决方案，打造高质量数据集解决方案公司拥有行业内自动化水平最高的标注平台Rosetta平台目前平台年处理数据量数亿，自动化水平达到60%以上数据质量达到99.9%，达到国际领先水平模型层：数量上，北京全国领先据不完全统计，全国范围已发布124个大模型，整体呈现“百模大战”状态，北京市相关企业和科研单位已累计发布54个大模型，数量在全国各省市中排名第一，占全国总数的44%。【模型层：北京专精特新企业情况在AIGC行业的大模型开发领域，有10家北京市专精特新企业，他们过去一年的平均营业收入超7600方元，平均研发投入约为5800万元，平均超60%的员工为研发人员。模型层：有代表性的北京专精特新企业 4Paradigm 智谱·AI 润舟科技3 澜舟科技智谱华章第四范式公司于2023年初发布孟子MChat可控大模型，支持BERT（分析类）GPT（生成类）和T5（翻译类）等不同的模型架构，能够覆盖阅读理解文本生成、机器翻译、对话等不同场景，并可根据行业和需求做出快速调整，在面向垂直领域、专业赛道等应用场景时有显著优势拥有输入输出多模态、知识库Copilot、思维链等核心技术，可实现私有化部署，降低企业算力成本并可实现信息输出时定位原始出处做到“有据可查随着用户的反馈“知错能改”。为企业使用大模型提供数据安全、内容可信、成本可控的三大保障在国内首家推出开源大模型ChatGLM-6B，截至目前在全球的下载量已超过百万同时研发双语干亿级超大规模预训练模型GLM-130B构建高精度通用知识图谱，基于此模型打造了对话式产品ChatGLM，部分能力超过ChatGPT AIGC共分为六类应用 AI大模型的出现对各行各业都带来深远影响：由AI生产的内容将遂渐成为众多行业中不可或缺的一部分。基于AI大模型的模态分类，AIGC应用可被划分六类。其中，文字生成应用发展时间较长、易于落地而跨模态生成赛道的发展潜力最高。【应用层：北京专精特新企业情况在AIGC行业的应用层，有22家北京市专精特新企业积极探索AI大模型在各行各业的应用，他们平均营业收入超1亿元，平均研发投入超3000万元。应用层：有代表性的北京专精特新企业百炼智能B>IL>N.>I AiXcoder 硅心科技百炼智能感易智能国内B2B智能营销的先行者，提供数据驱动、深耕场景的B2B智能营销SaaS产品及数字化解决方案，致力于通过AI技术帮助企业提升从市场洞察到销售线索开发、筛选、联系、转化的营销全流程效率。专注于AIGC编程领域的创业公司由北京大学软件研究所主持孵化，国际最早开展基于深度学习的代码生成与代码理解研究的科研团队，开发了国内首款基于代码大模型的智能编程系统在数据智能领域的算法、产品及系统架构研发经验平均超过10年。公司围绕多模态深度语义理解、图计算和大数据等相关技术创新，研发出金融信息认知大模型，依托AI技术为金融机构提供智能服务 2023年3月公司推出全面覆盖营销人员实际工作场景的营销大模型“爱迪生" AIGC产业链北京市专精特新企业图谱 AIGC产业链北京市专精特新企业图谱贝壳财经

点击免费查看完整报告