公共数据垂直模型已经箭在弦上。垂直模型是在通用大模型的基础上,利用细分行业特有的数据,训练出来的更加适合特定领域、有专门用途的专用模型。通用大模型解决了各行各业对AI“可用”的需求,而各领域的垂直模型则真正实现“好用”,是未来更专业的具体应用。这就使发展公共数据垂直模型成为必然趋势。垂直模型具备了核心的数据壁垒,因此也获得了较大的社会治理价值和商业应用价值,可以广泛的应用在政务、医疗、金融等公共数据聚集的行业,大大提升了对应行业的生产效率。各地政府和重要行业未来更有可能要求在自己的私有云上开发专属的政务/重要行业垂直模型。 公共数据垂直模型有望广泛应用在政务、医疗、金融等多个领域。政务服务方面,垂直模型可以提供以下能力:1)帮助政府更快速高效的处理各类政务事项,例如城市规划、交通流量控制、公共安全保障等;2)为政府决策提供更加科学的数据支持,有助于实现精准治理和精细化管理;3)预测和应对突发事件,通过收集和分析大量数据,提供更好的公共服务和社会治理水平。其余如国土资源、水利、应急管理、民政等公共数据都有其独特的使用价值和使用边界,都将会形成各自的重要行业垂直模型。 国资云有望承接公共数据垂直模型。国内更高质量的数据都掌握在政府手中,在中国的数据版图上,截至2023年3月我国政府数据资源占比超过3/4。公共数据垂直模型依赖于公共数据本身,涉及国计民生,国资背景厂商在平台、资源、市场、社会信任等方面具备天然的优势。国资云本身就是算力平台,同时可以持有和运营公共数据,在与市面上的通用大模型合作后,就可以形成公共数据垂直模型,成为未来的主流应用。 未来国内2800多个区县单位将有望开发自己的政务垂直模型。目前,部分地方政府和重要行业已经开始探索和国资云厂商合作使用垂直模型协助政务和业务开展,如《北京市促进通用人工智能创新发展的若干措施》中提及推动通用人工智能技术在政务服务领域率先试点应用。部分领先企业已经和地方政府、重要行业监管部门展开合作,如德阳市已经上线了深桑达旗下的飞思AI中台。每个区县都有大量的政务数据可以挖掘潜在价值,在数据不出域的前提下,为了满足各地不同的政务需求,我们预计各个县级单位都将有望开发自己的政务垂直模型。 医疗、金融等重要行业已经在陆续发布公共数据垂直模型。上海地区近期发布了“Uni-talk”医疗算网大模型,正是在通用模型基础能力之上,融入垂直领域专业知识,逐步实现通用人工智能到医疗人工智能领域的融会贯通。我们预计各重要行业都将打造自己的垂直模型,其核心数据作为公共数据一般被监管部门持有,重要行业未来将至少产生数量过千的公共数据垂直模型需求。 此外,很多重要行业的头部企业由于数据敏感性,并且考虑到垂直模型可能带来的商业价值,都倾向于自研垂直大模型,如农业银行、工商银行、中国电信等单位都已经在研究或发布自己的行业垂直模型,未来公共数据垂直模型的市场规模有望超出市场预期,进入百花齐放的阶段。 投资建议:国资云持有和运营公共数据,同时对外提供算力、算法应用供给。我们认为国资云有望成为公共数据垂直模型的主要载体,重点推荐深桑达A、易华录、云赛智联。 风险提示:政策推进不及预期;行业竞争加剧。 1.公共数据垂直模型已经箭在弦上 垂直模型是在通用大模型的基础上,利用垂直行业特有的数据,训练出来的更加适合特定领域、有专门用途的专用模型。通用大模型解决了各行各业对AI“可用”的需求,而各领域的垂直模型是未来更广泛的具体应用,真正实现“好用”。 公共数据垂直模型是必然趋势。首先,通过专属的训练数据集和定制化调优,垂直模型可以满足政府和重要行业的个性化需求,在通用模型基础能力之上,融入垂直领域专业知识,大幅提升场景感知和理解能力;其次,公共数据蕴含的信息量大,安全要求高,各地政府和重要行业可能要求数据不出域,而由于行业经验积累的壁垒,只有特定行业才能提供高质量的数据集,这也将成为未来差异化竞争的来源,因此各地政府和重要行业未来更有可能要求在自己的私有云上完成大模型的调优,并开发专属的政务/重要行业垂直模型。 公共数据垂直模型有望广泛应用在政务、医疗、金融等多个领域。公共数据垂直模型具备产权性质、商业机密性质,因为其具备了核心的数据壁垒,因此也获得了较大的社会治理价值和商业应用价值,可以广泛的应用在政务、医疗、金融等公共数据聚集的重要行业,大大提升了对应行业的生产效率。 政务服务方面,垂直模型可以提供以下能力:1)帮助政府更快速高效的处理各类政务事项,例如城市规划、交通流量控制、公共安全保障等;2)为政府决策提供更加科学的数据支持,有助于实现精准治理和精细化管理:如在城市治理中,开展多感知系统融合处理技术研发,实现智慧城市底层业务的统一感知、关联分析和态势预测,科学调配政府资源和行政力量;3)预测和应对突发事件,通过收集和分析大量数据,提供更好的公共服务和社会治理水平。 在医疗公共数据领域,垂直模型可以满足智能导诊、辅助诊断、智能治疗等场景需求:构建基于医疗领域通用数据与专业数据的智能应用,实现对各种疾病和症状的准确识别和预测,辅助医疗机构提高疾病诊断、治疗和预防的决策水平。 在金融公共数据领域,垂直模型可以协助智能风控、智能投顾、智能客服等环节,推动实现金融专业长文本的精准解析和模型知识的更新,突破复杂决策逻辑与模型信息处理能力间的融合技术,实现从复杂金融信息处理到投资决策建议的转化,支撑金融领域的投资辅助决策。 其余如国土资源、水利、应急管理、民政等公共数据都有其独特的使用价值和使用边界,都将会形成各自的公共数据垂直模型。 2.国资云:有望承接公共数据垂直模型 国内更高质量的数据都在政府手中,未来有望成为国内寻求差异化发展的重要支撑。 随着公共数据逐步开放运营,垂直行业数据由严监管向谋发展转变,数据要素市场化发展将使得算法厂商能够获得质量较高的公共和行业数据,提高训练质量和效率,进而为国内开发符合自身发展和价值观的大模型提供支撑。在中国的数据版图上,截至2023年3月我国政府数据资源占比超过3/4。 因此,能够获得如国家卫健委、应急管理部、公安部、国土资源局、金融、电信、各地方政府等机构公共数据运营权的厂商,就可以基于通用大模型在应用端获得更大的优势。 公共数据垂直模型依赖于公共数据本身,涉及国计民生,国资背景厂商在平台、资源、市场、技术、人才、社会信任等方面具备天然的优势。 国资云同时承担政府和重要行业的算力、数据和算法应用需求。国资云输出的是一种服务能力,包括了基础设施服务、算力服务、人工智能服务和大数据服务等等。通过国资云,一方面解决了算力供给问题,另一方面,通过国资云可以归集公共数据,提供高质量基础训练数据集;通过与相关头部算法厂商合作,国资云厂商可以进一步完善算法方面自研能力,从而同时具备算力、数据、算法这三大发展人工智能的必备要素。 国资云本身就是算力平台,同时可以持有和运营公共数据,在与市面上的通用大模型合作后,就可以形成公共数据垂直模型,成为未来的主流应用。 图1:中国电子云数据要素业务布局 3.公共数据专用大模型应用空间广阔 目前,部分地方政府和重要行业已经开始尝试使用垂直模型协助政务和业务开展。 近日发布的《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》中指出,要推动通用人工智能技术在政务服务领域率先试点应用,围绕政务咨询、政策服务、接诉即办、政务办事等工作,率先实现大模型技术赋能。 部分领先企业已经和地方政府和重要行业合作展开实践。如在德阳市,深桑达旗下的飞思AI中台通过一站式智能服务总入口的方式,为秒批秒办、在线公证等12类业务系统提供68个通用化AI模型服务组件,同时围绕智慧城管、智能客服、舆情分析等6大智能场景接入44个AI生态模型,共同解决政务服务处理效率低、响应慢等难题,快速推进AI服务能力的集成和统一共享,助力德阳数字经济发展与升级。 图2:飞思AI中台助力公文文档智能审核 飞思AI中台也为能源行业燃机运维监控系统,提供算法引擎开发、调试管理及发布服务等能力,研发出设备故障预警、健康度评估等74个模型,支撑客户完成自主开发行业场景的业务引擎和智能应用维护等工作。同时结合能源行业特点,设计并形成AI模型电厂边缘节点部署,分析数据回流到集团中心节点,再统一数据监控运维的完整闭环,满足能效分析、运行优化、故障预警及诊断等业务需求,实现燃机运维监控平台智能化建设目标。 图3:飞思AI中台架构 未来各个区县将有望开发自己的政务垂直模型,市场空间广阔。事实上,每个区县都有大量的政务数据可以挖掘潜在价值,如广东省梅州市五华县截至2022年8月已经采集了合计4236万多条数据,北京市海淀区也成立了自己的数据开放平台。截至2023年1月1日,我国共有2843个县级单位,数据资源将成为各地政府的重要资产,在数据不出域的前提下,为了满足各地不同的政务需求,我们预计各个县级单位都将有望开发自己的政务垂直模型,并伴随产生相关对数据治理、开发利用的需求,市场空间非常大。 图4:北京海淀区数据开放平台相关数据统计(截至2023年5月16日) 此外,医疗等重要行业已经在陆续发布垂直模型,上海联通携手华山医院、上海超算中心和华为联合组建的上海市算力网络数字医疗创新实验室在近期发布了“Uni-talk”医疗算网大模型,标志着算力网络在行业应用的深入探索和全新突破,通用人工智能向医疗行业人工智能迈出了坚实的一步。 “Uni-talk”是一款自主可控、行业定制的国产化大模型产品,由该实验室全部自主研发,在严格遵守国家数据安全管理要求的前提下,将数据信息进行私有化部署与训练,基于联通算网智能管控与算力统一调度编排能力,在通用模型基础能力之上,融入垂直领域专业知识,大幅提升场景感知和理解能力,逐步实现通用人工智能到医疗人工智能领域的融会贯通。 重要行业的公共数据垂直模型有望迎来高速增长。我们预计各重要行业都将打造自己的垂直模型,其核心数据作为公共数据一般被监管部门持有。我国国务院下属有近百个组成机构,分别负责能源、交通、金融、教育等重要行业的管理工作。每个部委又有多个下属单位,对应不同的行业细分,如农业农村部的公共数据垂直模型可以细分为渔业渔政类、种植业管理类、畜牧兽医类、农业机械化管理类等等,我们预计未来在重要行业将至少产生数量过千的公共数据垂直模型需求。 图5:国务院组成部门 事实上,很多重要行业的头部企业由于数据敏感性,并且考虑到垂直模型未来可能带来的商业价值,都倾向于自研开发专属大模型,如农业银行、工商银行、中国电信等单位都已经在研究或发布自己的行业垂直模型,未来公共数据垂直模型的市场规模有望超出市场预期,进入百花齐放的阶段,其市场空间想象力十足。 4.投资建议和相关标的 公共数据垂直模型是AI重要落地场景,有望广泛应用于政务和重要行业。公共数据蕴含的信息量大,安全要求高,各地政府和重要行业未来更有可能开发自己的专属政务/重要行业垂直模型。 我们预计未来国内2800多个县级单位、上千个细分垂直领域都将需要开发自己的垂直模型。 各地方、各重要行业、各央企已经针对公共数据垂直模型展开了卓有成效的有益探索。 公共数据垂直模型依赖于公共数据本身,涉及国计民生,国资背景厂商在平台、资源、市场、技术、人才等方面具备天然的优势。国资云厂商可以持有和运营公共数据,同时对外提供算力、算法应用供给。我们认为国资云有望成为公共数据垂直模型的主要载体,重点推荐深桑达A、易华录、云赛智联。 5.风险提示 政策推进不及预期。相关政策推进受到多种因素影响,节奏和力度可能不及预期。 行业竞争加剧。行业市场空间广阔,可能吸引更多公司参与行业竞争。