大模型是AI开发的新范式,是人工智能迈向通用智能的里程碑:大模型指通过在大规模宽泛的数据上进行训练后能适应一系列下游任务的模型,本质依旧是基于统计学的语言模型,只不过“突现能力”赋予其强大的推理能力。现有的大模型的框架在本质上是一致的,几乎所有参数规模超过千亿的大语言模型都采取GPT模式,但是不同类型的企业给予自己所在领域的优势,开发的大模型在功能上还是有所差异。技术对大模型的效果具有决定作用,因此未来竞争格局也依赖于技术突破。 算力是AI时代的“石油”:大模型的训练和推理都会用到AI芯片的算力支持,在数据和算法相同情况下,算力是大模型发展的关键,是人工智能时代的“石油”。我们假设GPT-3训练时间为一个月,则需要843颗英伟达A100芯片。我们假设GPT-3每日日活为5000万,则需要约16255颗英伟达A100芯片。GPT-4为多模态数据,我们预计算力需求量是GPT-3的10倍以上。中国大厂相继布局大模型,我们测算,仅十家头部厂商大模型1年内有望增加约20万片A100需求量。长期来看,则需求量有望超200万片,新增算力需求将使算力市场增长2倍以上。 2021年,中国加速卡市场中Nvidia占据超过80%市场份额,国产AI芯片性能与海外仍有差距,国产大模型推出有望加快国产芯片发展。 数据资源是AI产业发展的重要驱动力之一:数据集作为数据资源的核心组成部分,是指经过专业化设计、采集、清洗、标注和管理,生产出来的专供人工智能算法模型训练的数据。大规模语言模型性能强烈依赖于参数规模N,数据集大小D和计算量C,训练数据主要来自于维基百科、书籍、期刊、Reddit社交新闻站点、Common Crawl和其他数据集,GPT4依靠大量多模态数据训练。未来AI模型的竞争力或体现在数据质量和稀缺性,发展数据要素市场,促进相关公共、企业、个人数据的进一步放开,将为国内AI发展提供重要支撑。 AI赋能各行各业,未来是AI应用的星辰大海:AI堪比第四次技术革命,本轮最直接的应用在内容创作领域,打开产业的想象边界。我们应该去寻找在AI赋能下,应用功能显著改善、客户粘性显著提升,市场空间大幅提升的领域,主要有内容创作,办公软件,ERP,机器人以及芯片设计领域。当前部分大模型厂商已经开启产业化应用,但是算力依旧是限制AI大规模商业化落地的主要原因,一旦解决,直接受益AI+的将是信息化行业,因此我们看好各行业信息化领域处于优势地位的龙头公司。 投资建议:算法上,我们建议关注已经有先发优势的大模型公司:三六零、科大讯飞、同花顺等,此外还有一些实施企业,如软通动力、润和软件、汉得信息等;算力上,我们推荐景嘉微、中科曙光、神州数码,建议关注海光信息、寒武纪、四川长虹、拓维信息等;数据上,我们推荐各细分赛道的信息化龙头企业,如久远银海、容知日新、中控技术,建议关注国能日新、千方科技等;应用上,我们推荐在具备“杀手级”应用潜能的厂商金山办公、用友网络、恒生电子,建议关注广联达、石基信息等。 风险提示:政策推进不及预期;行业竞争加剧 1.算法:大模型——人工智能迈向通用智能的里程碑 当前大模型的商业模式是“通用大模型+产业模型”。底层AI大模型的研发具有极高的研发门槛,面临高昂的成本投入,不利于人工智能技术在千行百业的推广。而具有数据、算力、算法综合优势的企业可以将模型的复杂生产过程封装起来,通过低门槛、高效率的生产平台,向千行百业提供大模型服务。 一旦大模型技术出现突破,行业竞争格局有望一家独大。由于当前大模型的技术是公用的,没有哪家存在明显的技术领先,因此各行各业厂商纷纷入局,希望分得一杯羹,因此出现了大模型百花齐放的竞争格局。一旦出现技术突破,大模型的准确度以及智能化出现了“碾压”的优势,行业需求会迅速向NO.1集中,有望形成一家独大的竞争格局。 2.算力:AI训练的基础设施 国产AI芯片性能与海外仍有差距,国产大模型推出有望加快国产芯片发展。国产AI芯片厂商主要有寒武纪,景嘉微,沐曦,燧原等,但其产品性能距离海外仍有差距。 以国产寒武纪为例,MLU370性能为FP3224TFLOPS,仅为英伟达A100的10%不到。 要达到同等算力要求,国产芯片片数需求量会更大,但大量AI芯片并行运行会对控制能力有较高要求,难以满足。但发展自己的AI芯片产业迫在眉睫,各家厂商正在快速追赶。 3.数据:AI发展的驱动力 高质量、稀缺的数据放开对AI发展至关重要。发展国内自己的大模型需要国内的高质量、稀缺数据。然而,根据发改委高技术司,我国政府数据资源占全国数据资源的比重超过3/4,开放的规模却不足美国的10%,个人和企业可以利用的规模更是不及美国的7%,但这类数据的开放共享程度不高,全国开放数据集规模仅约为美国的11%,数据有待进一步开放汇集,为开发更符合国内需求的大模型提供基础。发展数据要素市场,促进相关公共、企业、个人数据的进一步放开,将为国内AI发展提供重要支撑。 我们认为可以主要关注两个方面:能够采集、处理细分行业稀缺数据的厂商:久远银海、容知日新、国能日新、千方科技、中控技术、千方科技、用友网络等,以及具有专业数据处理服务能力的通用第三方厂商:海天瑞声等。 4.应用:AI的星辰大海 我们应该去寻找“杀手级”的下游应用市场。所谓“杀手级”应用市场,即在AI赋能下,该应用功能显著改善,客户粘性显著提升,最后体现为客户付费率和付费单价显著提升,市场空间大幅提升。我们认为根据美国产业发展现状来看,当前来看已经涌现的“杀手级”应用领域主要有内容创作,办公软件,ERP,机器人以及芯片设计领域。 最直接的应用在内容创作领域。ChatGPT的功能核心是基于文本的理解和分析,与内容创作行业趋同。ChatGPT可用于创建新闻文章、博客文章甚至小说等内容,它可以生成原创且连贯的内容,为内容创作者节省时间和资源。 在办公软件领域是划时代的生产力的解放。我们认为办公场景是当前所能看到的AI最大级别应用场景,Microsoft365 Copilot将会带来需求的刚性,是人工智能杀手级应用。 在Word中,Copilot可以帮助打草稿、排版、修改;在Excel中,Copilot可以帮助用户修改样式,并进行数据分析、预测、可视化等;在PPT中,Copilot能够基于文本自动绘制PPT,根据PPT生成讲稿。 与ERP的结合有望重构企业管理。ERP能够学习企业管理“通用数据”,又能学习企业管理“私有数据”,让ERP在做到贯彻领先企业管理理念的同时,越来越个性化,低成本满足企业对ERP定制化的需求。ERP使用流程繁琐,使用ChatGPT和直接询问,获得想要的信息,可降低使用者门槛。 ChatGPT解决了机器人的痛点。ChatGPT开启了一种新的机器人范式,允许潜在的非技术型用户参与到回路之中,ChatGPT可以为机器人场景生成代码。在没有任何微调的情况下,利用LLM的知识来控制不同的机器人动作,以完成各种任务。 看好ChatGPT在芯片设计领域的应用。传统的芯片设计强烈依赖模板而忽视了大量可以复用的优秀数据,同时数据量大导致ChatGPT泛化性更好。此外芯片硬件模块相对单一,有一些成熟范式,芯片设计代码复杂但人工不足,这些都与ChatGPT有很好的互补。 5.投资建议与相关标的 算法上,我们建议关注已经有先发优势的大模型公司:三六零、科大讯飞、同花顺等,此外还有一些实施企业,如软通动力、润和软件、汉得信息等; 算力上,我们推荐景嘉微、中科曙光、神州数码,建议关注海光信息、寒武纪、四川长虹、拓维信息等; 数据上,我们推荐各细分赛道的信息化龙头企业,如久远银海、容知日新、中控技术,建议关注国能日新、千方科技等; 应用上,我们推荐在具备“杀手级”应用潜能的厂商金山办公、用友网络、恒生电子,建议关注广联达、石基信息等。 6.风险提示 政策推进不及预期。相关政策推进受到多种因素影响,节奏和力度可能不及预期。 行业竞争加剧。行业市场空间广阔,可能吸引更多公司参与行业竞争。