一、定义及分类 大模型是大规模语言模型(Large Language Model)的简称,是指模型具有庞大的参数规模和复杂程度的机器学习模型。这些模型通常在训练过程中需要大量的数据和计算能力,并且具有数百万到数十亿个参数。大模型的设计目的是为了提高模型的表示能力和性能,在处理复杂任务时能够更好地捕捉数据中的模式和规律。根据其应用场景和功能,大模型可分为自然语言处理大模型、计算机视觉大模型、语音识别大模型、推荐系统大模型、强化学习大模型、生成对抗网络大模型、对话系统大模型等。 二、行业政策 1、主管部门和监管体制 大模型行业主管部门主要是指工业和信息化部,其主要负责拟订实施行业规划、产业政策和标准; 监测工业行业日常运行;推动重大技术装备发展和自主创新;管理通信业;指导推进信息化建设;协调维护国家信息安全等。 中国人工智能产业发展联盟是行业的自律性组织,其宗旨是将认真贯彻落实党中央、国务院有关决策部署,以国家产业政策为导向,以市场为驱动,以企业为主体,搭建产学研用合作平台,促进联盟成员的研发、设计、生产、集成、服务等水平,构建我国人工智能产业生态,提升我国人工智能产业的竞争力,强化人工智能与经济社会各领域深度融合,促进技术进步、提高生产效率,推动传统行业数字化转型,支持新技术、新产业、新业态、新模式加快发展。 2、行业相关政策 近年来,大模型已逐渐得到国家政府的高度重视,出台了一系列政策和措施来推动行业发展。如2023年7月发布的《人工智能气象应用工作方案(2023—2030年)》中,提出启动气象预报大模型等新兴技术研发,开展人工智能新兴技术与监测预警、预报预测、数值预报和专业服务“四大领域”融合。2023年11月发布的《人形机器人创新发展指导意见》中,提出建设大模型训练数据库,创新数据自动化标注、清洗、使用等方法,扩充高质量的多模态数据。科学布局人形机器人算力,加速大模型训练迭代和产品应用。随着这些政策的顺利实施,我国大模型产业将得到快速发展。 三、发展历程 随着人工智能的快速发展,大模型成为当前研究的热点之一。国内在大模型的发展上也取得了显著的进展。从发展历程来看,我国大模型主要分为三个阶段:起步阶段、应用拓展阶段、产业化阶段。 2001年,中国科学院计算技术研究所成立了机器学习与数据挖掘实验室,开始了对大模型的研究工作。2011年,百度推出基于大数据和大模型的搜索算法“海量深度学习技术”,取得了重大突破。此后,国内的互联网公司纷纷加大在大模型领域的研发投入,推动了大模型的应用拓展。2016年阿里巴巴成立“达摩院”,并在大模型研究方面取得了一系列的突破。同年,腾讯成立了“腾讯研究院”,推动了大模型在智能推荐、自然语言处理等领域的应用。2019年国内的大模型研究取得了重大突破,其中最为重要的是在自然语言处理领域。2020年国内的大模型开始向其他领域拓展,如计算机视觉、语言识别等。 四、行业壁垒 1、技术壁垒 技术壁垒是大模型行业面临的主要挑战之一。大模型技术的研发需要大量的专业知识和技术积累,包括深度学习、自然语言处理、计算机视觉等多个领域。这使得一些技术实力较弱的企业难以进入该领域或难以在竞争中取得优势。同时,大模型技术的更新换代速度非常快,企业需要不断投入研发资源进行技术创新,否则很容易被市场淘汰。 2、资金壁垒 大模型的研发需要投入大量的资金用于算法研究、模型训练、数据收集和处理等方面。如在模型训练方面,行业内企业通常需要高性能的计算机和大量的计算资源,这意味着企业需要投入大量的资金购买和维护这些设备。对于一些规模较小的企业来说,这是一笔不小的开支,难以承受。因此,大模型行业的资金壁垒较高,新进入者需要充分考虑自身的资金实力和融资能力。 3、人才壁垒 大模型行业是一个多学科交叉的领域,涵盖了深度学习、自然语言处理、计算机视觉等多个专业领域。这意味着从业人员不仅需要具备扎实的专业知识,还需要具备跨学科的视野和综合能力。然而,目前这种复合型的人才需求使得该领域的人才供给相对紧张,导致企业难以招聘到合适的人才。对于新进入者来说,大模型行业具有较高的人才壁垒。 五、产业链 1、行业产业链分析 从大模型行业产业链来看,上游主要包括硬件和软件,硬件又包括芯片、服务器、通信网络等; 软件又包括云计算、数据库、中间件等。中游是指大模型行业;下游是指大模型的应用领域,包括游戏、办公、传媒影视、医疗、金融、电商、工业等,这些领域的多样化需求将推动大模型不断进行技术创新和优化,提升模型的准确性和效率。 2、行业领先企业分析 (1)深圳市腾讯计算机系统有限公司 深圳市腾讯计算机系统有限公司于1998年成立,并于2004年在港交所成功上市。经过20年的发展,腾讯由一家聊天软件开发商逐步成长为全球最大的互联网企业之一。通过广告、游戏、社交、支付等多个业务板块相互交织,形成了一个庞大的产品和服务生态系统,公司规模及企业影响力持续扩大。近年来,随着新一代信息技术的崛起,腾讯持续加大在人工智能、物联网、云计算投资布局及技术研发,已取得较大成果。公司拥有超10亿用户的连接能力,旗下多个版块业务发展至今已积累了大量的数据和技术经验,使其在发展大模型方面具有天然优势。腾讯正围绕大模型产业链核心节点展开技术布局,夯实算法、算力和数据“底座”,并于2023年9月正式发布混元大模型,参数规模超千亿,已在多个内部产品测试。从企业经营业绩来看,2023年前三季度公司实现收入4538.2亿元,同比增长11%;归母净利润达到881.91亿元,同比增长7.58%。 (2)百度在线网络技术(北京)有限公司 百度在线网络技术(北京)有限公司成立于2000年,是国内领先的AI公司,同时也是全球为数不多的集AI芯片、软件构架和应用程序等全栈AI技术研发及生产为一体的公司之一。目前,公司的核心业务包括搜索服务、交易服务、移动生态、智能云和智能驾驶等。2023年,公司各项业务均呈现稳中向好的发展态势,其中,AI成为百度的增长新动力,这主要得益于公司在迭代文心大模型与文心一言、重构产品和服务、以及商业化方面取得重大进展。公司全面推进旗下产品及服务的AI原生化重构,推出百度新搜索、百度新文库、文心一言App等AI原生应用,以及轻舸、品牌智能体等AI营销工具。从企业经营业绩来看,2023年公司实现营业收入1345.98亿元,同比上涨8.83%,归母净利润达到203.15亿元,同比上涨191.55%。 六、行业现状 当前,“ChatGPT”“文心一言”“盘古Chat”等大模型的爆火推动了新一轮人工智能技术发展热潮,AI大模型相关研究、产品不断涌现,中国大模型产业规模快速增长。据统计,中国AI大模型行业市场规模从2020年的15亿元增长至2022年的70亿元,年均复合增长率达116.02%,2023年市场规模为147亿元。预计2024年中国AI大模型行业市场规模将达216亿元,行业发展前景广阔。 七、发展因素 1、机遇 (1)国家政策的大力支持 国家和地方政府对于大模型的发展给予高度重视,制定并出台了一系列法律法规和政策支持。如2023年12月,国家数据局等17部门发布《“数据要素×”三年行动计划(2024—2026年)》,其中提出以科学数据支持大模型开发,深入挖掘各类科学数据和科技文献,通过细粒度知识抽取和多来源知识融合,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展人工智能大模型开发和训练。这将有利于推动大模型的开发和应用,为人工智能技术的发展注入新的活力。 (2)下游应用场景广阔 越来越多的行业开始意识到大模型在提高效率、降低成本、创新业务模式等方面的潜力,纷纷加大投入,推动大模型在各自领域的应用。在医疗领域,大模型可以帮助医生更快速地诊断疾病,通过分析大量的医疗数据,提高诊断的准确性和效率。在金融领域,大模型可以应用于风险评估和欺诈检测,快速识别潜在风险,提高金融机构的运营效率。在制造业中,大模型可以优化生产流程,提高生产效率,降低生产成本。大模型的应用场景正在不断拓展。 (3)技术水平不断提升 随着技术水平的不断提升,大模型的能力越来越强大,能够处理更为复杂、精细的任务。如在算法方面,深度学习算法的不断成熟和演进使得大模型的性能和精度得到了显著提升。研究者们通过持续探索和优化算法,使得大模型在各个领域的应用效果得到了进一步提升。这包括改进模型的架构、优化训练过程、提升模型的泛化能力等,从而使得大模型能够更好地适应各种复杂场景和任务。 2、挑战 (1)泛化能力和鲁棒性不足 大模型虽然具有强大的学习能力和特征提取能力,但往往存在过拟合和泛化能力不足的问题。这通常是因为模型过于依赖训练数据的特定特征,而未能学习到更一般化的规律。同时,大模型也容易受到一些攻击和干扰,其性能可能会受到严重影响。例如,在医学图像诊断中,模型可能会因为图像的微小变化或噪声而产生错误的诊断结果。 (2)数据质量和多样性问题 大模型需要大量的数据进行训练,但数据的质量和多样性往往存在很多问题。这不仅会影响模型的训练效果,也会增加模型的风险和不可预测性。如数据不一致问题的出现有可能导致模型在训练过程中学习到错误的模式,从而影响其在真实场景中的表现;数据泄露问题的出现可能会对个人隐私和企业安全造成威胁;数据偏斜问题的出现可能导致模型会过于依赖这些偏斜的特征,导致在真实场景中的性能下降。 (3)技术更新迭代风险 技术发展的快速性意味着新的模型架构、算法和训练方法不断涌现。大模型作为技术的前沿领域,其相关的技术更新换代速度尤为迅速。新的技术可能在性能、效率或适用性方面相较于旧技术有显著的提升。如果大模型不能及时跟进最新的技术更新,其性能可能会逐渐落后,甚至被新的模型完全取代。此外,随着技术的不断进步,旧版本的模型可能逐渐失去与新技术的兼容性,导致维护和升级变得困难。 八、竞争格局 随着人工智能领域的飞速发展,各大科技公司纷纷布局大模型市场,以推动科技创新和产业变革。 在这波澜壮阔的时代背景下,华为、阿里巴巴、腾讯、百度等中国科技巨头竞相推出了自家的大模型,各自拥有独特的特点和重要的合作伙伴。可见,我国在大模型市场的竞争格局日益激烈,各家公司都在寻找创新的应用场景,并与各个行业的龙头企业建立合作关系。 九、发展趋势 大模型产品百花齐放的当下,模型实现了计算机能力从“搜索”到“认知与学习”,再以进一步发展为“行动与解决方案”层面。除常见的智能客服、智能推荐、情感分析等应用领域以外,大模型逐步于教育、医疗、金融等垂直领域得到了广泛应用,行业应用场景日趋多样化。同时,随着大模型相关技术不断创新,将推动大模型实现模型规模缩小、模型性能提升,进一步促进大模型发展。此外,伴随计算机视觉、语音识别等技术的不断发展,跨模态大模型也逐渐成为研究热点,未来相关企业将不断加强投入推动跨模态大模型的发展。