计算机 大模型公司的四大发展路径 BaseModel提供者:赋能万物。自OpenAI发布ChatGPT以来,海内外厂商都加速布局基础大模型的研发,所有大模型的训练都分为两步:首先通过预训练形成基础模型,然后针对特定领域做微调。通过这种过程,原则上来说只要有细分 领域数据,大模型就可以针对垂直领域做优化,赋能各行各业。目前国内基础大 证券研究报告|行业周报 2023年04月22日 增持(维持) 行业走势 模型百花齐放,多家厂商已陆续推出大模型并开始用于自身业务或寻找行业伙伴 进行落地,成为BaseModel可赋能万物,拥有极大的空间。 行业预训练大模型:比微调通用性更优。除了基础大模型,许多大模型厂商都致力于推出各类行业大模型。实际应用并不一定需要大模型具有非常全面的能力,而更需要对行业知识的理解和对行业需求的适配,在具体行业上,行业大模型的 泛化等能力往往要优于基础大模型+微调。百度文心大模型与各行业企业联手,在通用大模型的基础上打造能源、金融、航天、制造、传媒等具体行业大模型。华为将大模型体系分为了基础大模型L0、行业大模型L1、细分场景模型L2三层。科大讯飞也提出“1+N”战略,“1”是通用大模型算法研发及高效训练底座平台, 64% 48% 32% 16% 0% -16% 计算机沪深300 “N”是教育、医疗、人机交互、办公等行业大模型。 结合模型的深度微调,通过Knowhow、数据形成场景、方案。基础大模型或者行业大模型最终需要结合实际应用场景进行落地,这个阶段需要深度微调。在用场景数据深度微调模型时,需要丰富的行业经验Knowhow进行评价和指导,前 2022-042022-082022-122023-04 作者 期得到的模型输出可能还并不够完美,此时就需要有行业经验的专家对模型的输 出进行评价,给出修改意见,再重新结合场景数据进行深度微调。除了结合Knowhow与数据微调模型,还需要形成具体方案。每个场景所需要解决的问题不同,最终需要将模型与实际问题结合,与场景进行交互,形成具体的解决方案仍然会实现较强的效果和较大的壁垒。 积累训练经验,转向场景与方案厂商,依旧有优势。应用落地首先要依赖大模型的基础能力,因此一方面大模型厂商将致力于提升大模型的基础能力,积累的训练经验对于模型能力提升尤其重要,同时训练经验还可以极大降低预训练新行业 模型的以及模型落地新场景微调的成本和。另一方面除了大模型本身的差异,需要竞争的就是具体落地方案,在各应用场景落地解决方案的积累,可以帮助厂商更好地满足行业客户的具体需求,同时还可能对于类似客户形成规模效应。未来积累了丰富经验的厂商,将对应用行业可以提供一站式的解决方案,全方位满足客户需求。很多投资者会静态地看待大模型公司的发展,这是一个时代的起点,在浪潮之巅探索的企业多积累的经验可能远远超出想象,即使失之东隅,仍然收之桑榆。 建议关注: 算力:英伟达、中科曙光、海光信息、寒武纪、易华录、光通信产业链、拓维信息、常山北明、神州数码、浪潮信息、景嘉微、工业富联。 大模型及技术公司:百度、阿里、华为、360、科大讯飞、云从科技、昆仑万维、海天瑞声、拓尔思、腾讯、字节跳动等。 应用:1)对标微软办公:微软、金山办公、彩讯股份;2)多模态GPT(输入输出信号变化):大华股份、海康威视、万兴科技、千方科技、当虹科技、云从科技、萤石网络、商汤科技、中科创达、新国都等。3)互联网传媒:昆仑万维、汤姆猫、蓝色光标、中文在线、利欧股份、游戏、数字人、电商等。4)智能助理(耳机/音箱):漫步者、科大讯飞、传音控股、国光电器、恒玄科技、奋达科技、惠威科技等。5)其他优质应用:同花顺、恒生电子、金证股份、上海钢联、石基信息、汉得信息等。6)AI安全:新华网、人民网、电科网安、美亚柏科、安恒信息等。7)国内巨头合作:光云科技、赛意信息、云鼎科技、朗新科技、润和软件、软通动力等。8)医疗应用:润达医疗、嘉和美康、卫宁健康、创业慧康。8)机器人:三花智控、拓普集团、鸣志电器、绿的谐波、晶品特装。 风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。 分析师刘高畅 执业证书编号:S0680518090001邮箱:liugaochang@gszq.com 相关研究 1、《计算机:多模态GPT,朝着科幻前进》2023-04- 20 2、《计算机:微软COPILOT做PPT需要哪些技术?》 2023-04-15 3、《计算机:DeepSpeed-Chat,应用与算力的加速器2023-04-15 请仔细阅读本报告末页声明 内容目录 1、BASEMODEL提供者:赋能万物3 2、行业的预训练大模型3 3、结合模型深度微调,通过KNOWHOW、数据形成场景、方案5 4、积累训练经验,转向场景与方案5 5、投资建议6 6、风险提示6 图表目录 图表1:AI从训练到落地应用流程3 图表2:百度行业大模型概念图4 图表3:华为大模型层级5 1、BaseModel提供者:赋能万物 自OpenAI发布ChatGPT以来,海内外厂商都加速布局基础大模型的研发,所有大模型的训练都分为两步:首先通过预训练形成基础模型,然后针对特定领域做微调。通过这种过程,原则上来说只要有细分领域数据,大模型就可以针对垂直领域做优化,赋能 各行各业。 图表1:AI从训练到落地应用流程 资料来源:国盛证券研究所 国内基础大模型百花齐放,多家厂商陆续推出大模型并开始用于自身业务或寻找具体行业伙伴进行落地。包括百度文心一言、阿里通义千问、360智脑、商汤SenseChat、昆仑万维天工大模型以及科大讯飞星火认知大模型。未来大模型厂商将成为各行业的AI基础 能力供应方,赋能万物,拥有极大的空间。 2、行业的预训练大模型 除了基础大模型,许多大模型厂商都致力于推出各类行业大模型。因为具体到实际应用上,并不一定需要大模型具有非常全面的能力,而更需要对行业知识的理解和对行业需 求的适配,在行业里的具体场景上,行业大模型往往比直接用基础大模型去微调具有更好的泛化能力。因此基于基础大模型和行业数据训练行业大模型,一方面可以更精准匹 配行业需求,一方面也能降低成本,因为并不是所有行业都需要其他行业的知识,行业大模型相对基础大模型可以优化模型规模。 百度文心大模型与各行业企业联手,在通用大模型的基础上学习行业特色数据与知识,建设行业AI基础设施。目前包括能源、金融、航天、制造、传媒等行业。如国家电网与百度联合发布知识增强的电力行业大模型,建设更适配电力行业场景的AI基础设施,降 低数据标注成本,提升细分场景模型效果;人民网与百度在传媒行业、大数据和AI算法上结合,引入人民网舆情数据中心积淀的行业知识,顺应内容与技术发展,联合研发知识增强的传媒行业大模型,打造全媒体时代内容科技创新引擎,加速传媒行业的智能化升级等。 图表2:百度行业大模型概念图 资料来源:百度官网,国盛证券研究所 4月8日,人工智能大模型技术高峰论坛上,华为云人工智能首席科学家田奇表示AIforIndustries是人工智能新的爆发点,华为将大模型划分为3个层级,分别为基础大模型L0、行业大模型L1、细分场景模型L2。将基础大模型L0与行业数据结合训练得到行业大模型L1,再将行业大模型L1应用于下游细分场景,进行微调和部署,得到细 分场景模型L2。华为云于2021年4月发布三个基础大模型,包括NLP大模型、CV大模型和科学计算大模型,之后又陆续发布了各种行业大模型包括气象大模型、药物分子大模型、矿山大模型、海浪预测大模型等。 图表3:华为大模型层级 资料来源:央广网,国盛证券研究所 4月20日,科大讯飞举办业绩说明会,强调公司正在推进“1+N认知大模型”战略。其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、 医疗、人机交互、办公等多个领域的专用大模型版本。并将于5月6日举办认知大模型成果发布会。 3、结合模型深度微调,通过Knowhow、数据形成场景、方案 基础大模型或者行业大模型最终需要结合实际应用场景进行落地,这个阶段需要深度微调。即使大模型已经拥有强大智能,但可能缺乏特定场景的知识,也需要结合具体场景的需求,因此在落地时依然需要场景数据进行微调。 在用场景数据深度微调模型时,需要丰富的行业经验Knowhow进行评价和指导。在通过场景数据对大模型进行微调后,前期得到的模型输出可能还并不够完美,此时就需要 有行业经验的专家对模型的输出进行评价,给出修改意见,再重新结合场景数据进行深度微调。 除了结合Knowhow与数据微调模型,还需要形成具体方案。每个场景所需要解决的问题不同,最终需要将模型与实际问题结合,与场景进行交互,形成具体的解决方案才能真正得到价值。比如对工业场景进行改造,可能涉及到模型具体需要和工厂内的哪些设 备进行交互,还要考虑具体的作业流程。 4、积累训练经验,转向场景与方案 积累的训练经验,以及落地解决方案的经验,将形成厂商的竞争优势,帮助大模型厂商不断进化。应用落地首先要依赖大模型的基础能力,因此一方面大模型厂商将致力于提升大模型的基础能力,积累的训练经验对于模型能力提升尤其重要,同时训练经验还可 以极大降低预训练新行业模型的以及模型落地新场景微调的成本。另一方面除了大模型本身的差异,需要竞争的就是具体落地方案,在各应用场景落地解决方案的经验积累,可以帮助厂商更好地满足行业客户的具体需求,同时还可能对于类似客户形成规模效应。未来积累了丰富经验的厂商,将对应用行业可以提供一站式的解决方案,全方位满足客户需求。很多投资者会静态地看待大模型公司的发展,这是一个时代的起点,在浪潮之巅探索的企业多积累的经验可能远远超出想象,即使失之东隅,仍然收之桑榆。 5、投资建议 建议关注: 算力:英伟达、中科曙光、海光信息、寒武纪、易华录、光通信产业链、拓维信息、常 山北明、神州数码、浪潮信息、景嘉微、工业富联。 大模型及技术公司:百度、阿里、华为、360、科大讯飞、云从科技、昆仑万维、海天瑞声、拓尔思、腾讯、字节跳动等。 应用:1)对标微软办公:微软、金山办公、彩讯股份;2)多模态GPT(输入输出信号变化):大华股份、海康威视、万兴科技、千方科技、当虹科技、云从科技、萤石网络、商汤科技、中科创达、新国都等。3)互联网传媒:昆仑万维、汤姆猫、蓝色光标、中文在线、利欧股份、游戏、数字人、电商等。4)智能助理(耳机/音箱):漫步者、科大讯飞、传音控股、国光电器、恒玄科技、奋达科技、惠威科技等。5)其他优质应用:同花顺、恒生电子、金证股份、上海钢联、石基信息、汉得信息等。6)AI安全:新华网、人民网、电科网安、美亚柏科、安恒信息等。7)国内巨头合作:光云科技、赛意信息、云鼎科技、朗新科技、润和软件、软通动力等。8)医疗应用:润达医疗、嘉和美康、卫宁健康、创业慧康。8)机器人:三花智控、拓普集团、鸣志电器、绿的谐波、晶品特装。 6、风险提示 AI技术迭代不及预期风险:若AI技术迭代不及预期,NLP技术理解人类意图水平未能取得突破,则对产业链相关公司会造成一定不利影响。 经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响,NLP技术应用落地将会受限。 行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。 免责声明 国盛证券有限责任公司(以下简称”本公司”)具有中国证监会许可的证券投资咨询业务资格。本报告仅供本公司的客户使用。本公司不会因接收人收到本报告而视其为客户。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。 本报告的信息均来源于本公司认为可信的公开资料,但本公司及其研究人员对该等信息的准确性及完整性不作任何保证。本报告中的资料、意见及预测仅反映本公司于发布本报