您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东方证券]:算力网文件正式发布,大模型应用加速落地 - 发现报告
当前位置:首页/行业研究/报告详情/

算力网文件正式发布,大模型应用加速落地

信息技术2024-01-01浦俊懿、陈超、谢忱、杜云飞东方证券Z***
AI智能总结
查看更多
算力网文件正式发布,大模型应用加速落地

行业研究|行业周报 看好(维持) 算力网文件正式发布,大模型应用加速落地 计算机行业 国家/地区中国 行业计算机行业 报告发布日期2024年01月01日 核心观点 上周计算机板块上涨2.27%,与各主要指数基本持平。我们认为,元旦前的持续反弹使得市场情绪有所修复,投资者有望继续围绕数据要素、算力等政策主线做布局 并关注业绩确定性品种。 全国一体化算力网加速构建:周五,发改委等五部委正式发布《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,建设联网调度、普惠易用、绿 色安全的全国一体化算力网。在算力网加速建设的背景下,算力行业将从现在垂直一体化的方式走向算力提供、算力调度、算力运营等多个产业链环节,其中算力的调度和运营,是将分散的算力基础设施进行连接、实现算力低门槛、普惠化的关键,是未来算力建设最受益的的方向。 多模态大模型进展较快,未来应用空间广阔:我们认为,多模态大模型一方面有利于形成图片、视频等更加生动活泼、更具交互性的应用,从而有助于C端爆款的诞 生;另一方面,多模态大模型能真正打通物理世界和数字世界的障壁,用最基础的感知世界能力直接生成操作,实现与物理世界最自然的交互,从而对自动驾驶、人形机器人等具身智能领域的突破提供有力支撑。 数据要素产业催化与落地值得期待:近期,发改委发布《“数据要素×”三年行动计划(2024-2026)》征求意见稿,推动数据要素在制造、农业、商贸、交通、金融、医疗等12个行业场景端落地。而上市公司也在加紧与地方数据集团合作,如银 之杰近期与青岛公共数据运营方签订战略合作协议。我们认为,在政策加持下,行业落地有望提速,而投资者将更为关注。 投资建议与投资标的 算力网为代表的数字基建领域,建议关注中科曙光(603019,买入)、思特奇(300608,未评级)、海光信息(688041,买入)、亚康股份(301085,未评级)、众合 科技(000925,未评级)、首都在线(300846,未评级)、铜牛信息(300895,未评级)、优刻得-W(688158,未评级)等。 大模型正加速向B端和C端落地渗透,建议关注金山办公(688111,增持)、新致软件(688590,未评级)、虹软科技(688088,未评级)、科大讯飞(002230,买入)、中科创达(300496,买入)、彩讯股份(300634,未评级)、万兴科技(300624,未评级)。 数据要素板块,建议关注银之杰(300085,未评级)、广电运通(002152,未评级)、中科江南(301153,未评级)、久远银海(002777,未评级)、上海钢联(300226,增 持)、通行宝(301339,未评级)、每日互动(300766,未评级)、深桑达A(000032,未评级)、云赛智联(600602,未评级)、三维天地(301159,未评级)、易华录(300212,未评级)、山大地纬(688579,未评级)等标的。 其他:建议关注远光软件(002063,买入)、航天宏图(688066,买入)、普联软件 (300996,未评级)等标的 风险提示 技术落地不及预期;政策监管风险 浦俊懿021-63325888*6106 pujunyi@orientsec.com.cn 执业证书编号:S0860514050004 陈超021-63325888*3144 chenchao3@orientsec.com.cn 执业证书编号:S0860521050002 谢忱xiechen@orientsec.com.cn 执业证书编号:S0860522090004 杜云飞duyunfei@orientsec.com.cn 执业证书编号:S0860523120001 覃俊宁qinjunning@orientsec.com.cn 宋鑫宇songxinyu@orientsec.com.cn 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 一、本周行业观点4 二、本周行业专题:RAG技术在大模型应用中的作用4 2.1RAG:检索增强生成4 2.2RAG是构建AI智能体应用的重要组成部分6 投资建议与投资标的8 风险提示8 图表目录 图1:常见的模型幻觉现象4 图2:RAG技术发展历程4 图3:RAG的工作流程6 图4:由LLM驱动的自主智能体系统的架构6 图5:AssistantAPI功能7 图6:Assistant创建页面7 图7:百度智能云千帆AppBuilder平台框架7 图8:AppBuilder界面7 表1:RAG和微调的比较5 一、本周行业观点 上周计算机板块上涨2.27%,与各主要指数基本持平。我们认为,元旦前的持续反弹使得市场情绪有所修复,投资者有望继续围绕数据要素、算力等政策主线做布局并关注业绩确定性品种。 全国一体化算力网加速构建:周五,发改委等五部委正式发布《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,建设联网调度、普惠易用、绿色安全的全国一体化算力网。在算力网加速建设的背景下,算力行业将从现在垂直一体化的方式走向算力提供、算力调度、算力运营等多个产业链环节,其中算力的调度和运营,是将分散的算力基础设施进行连接、实现算力低门槛、普惠化的关键,是未来算力建设最受益的的方向。 多模态大模型进展较快,未来应用空间广阔:我们认为,多模态大模型一方面有利于形成图片、视频等更加生动活泼、更具交互性的应用,从而有助于C端爆款的诞生;另一方面,多模态大模型能真正打通物理世界和数字世界的障壁,用最基础的感知世界能力直接生成操作,实现与物理世界最自然的交互,从而对自动驾驶、人形机器人等具身智能领域的突破提供有力支撑。 数据要素产业催化与落地值得期待:近期,发改委发布《“数据要素×”三年行动计划(2024-2026)》征求意见稿,推动数据要素在制造、农业、商贸、交通、金融、医疗等12个行业场景端落地。而上市公司也在加紧与地方数据集团合作,如银之杰近期与青岛公共数据运营方签订战略合作协议。我们认为,在政策加持下,行业落地有望提速,而投资者将更为关注。 二、本周行业专题:RAG技术在大模型应用中的作用 2.1RAG:检索增强生成 检索增强生成(Retrieval-AugmentedGeneration,RAG)是一种使用外部知识库来补充大语言模型(LLM)的上下文并生成响应的技术。常见的LLM会接受大量的训练数据,将广泛的常识知识存储在神经网络的权重中。然而,当我们在提示大模型生成训练数据之外的知识时,例如最新知识、特定领域知识等,LLM的输出可能会导致事实不准确,这就是我们常说的模型幻觉。传统的解决方法是通过微调神经网络模型来适应特定领域的专有信息。尽管这种技术很有效,但它属于计算密集型的,并且需要技术专业知识,使其难以灵活地适应不断变化的信息。2020年学者们在知识密集型NLP任务中提出了一种更灵活的技术,称为检索增强生成。简单来说,RAG对于LLM来说就像学生的开卷考试一样。在开卷考试中,学生可以携带参考材料,例如课本或笔记,可以用来查找相关信息来回答问题。 图1:常见的模型幻觉现象图2:RAG技术发展历程 数据来源:TowardsDataScience,东方证券研究所数据来源:Gao《Retrieval-AugmentedGenerationforLargeLanguageModels:ASurvey》,东方证券研究所 和传统的针对特定领域微调方法相比,RAG技术要更加简单且高效。微调能够对模型的知识产生显著的改进,但是要耗费大量的计算资源,成本较高,并且对不太常见和更加具体的知识来说微调的效果不明显。而RAG则是基于对外部知识的检索实现的,对于计算资源的要求相比微调显著降低,并且能够通过对外部知识的不断更新来保证LLM的知识更新。 表1:RAG和微调的比较 特征比较 RAG 微调 知识更新 直接更新外部知识源,无需对模型进行重训练 需要进行重新训练 外部知识 能够高效检索外部知识,适用结构化和非结构化数据库 能够通过预训练对齐外部知识,但对于经常变化的知识较难应用 数据处理 仅需少量处理 需要构建高质量数据库才能带来显著效果提升 模型定制化 只专注于外部信息检索,无法完全定制模型风格 可以对模型风格进行定制 可解释性 能够检索外部信息来源,具备更高可解释性和可追溯性 黑盒系统,可解释性较差 计算资源 主要用于检索策略 准备高质量数据库、微调训练都很消耗计算资源 延迟 检索过程会带来更高的回复延迟 在微调完成后回复延迟较低 幻觉减少 幻觉显著降低 在特定领域幻觉降低,但对于不熟悉的问题仍可能产生幻觉 数据来源:Gao《Retrieval-AugmentedGenerationforLargeLanguageModels:ASurvey》,东方证券研究所 RAG的目的是让LLM的推理能力与事实知识分离。LLM将参数知识——即在训练期间学习到的知识,隐式存储在神经网络的权重中。将非参数知识存储在外部知识源中,例如向量数据库等, 再通过RAG技术进行检索,实现让LLM更加注重自身的推理能力。常见的RAG可以分为检索、增强和生成三个步骤: 1)检索:根据用户请求从外部知识源检索相关上下文。需要先使用Embedding模型将用户查询嵌入到与向量数据库中的外部知识相同的向量空间中,以便与向量数据库中的信息进行比对。通过这种相似性搜索,可以找到向量数据库中最匹配的前k个数据。 2)增强:接着,将用户的查询和检索到的额外信息一起嵌入到一个预设的提示模板中。 3)生成:最后,这个经过检索增强的提示内容会被输入到大语言模型(LLM)中,以生成所需的输出。 图3:RAG的工作流程 数据来源:TowardsDataScience,东方证券研究所 2.2RAG是构建AI智能体应用的重要组成部分 Agent应用需要长期记忆,RAG技术不可或缺。随着生成式AI技术的不断发展,AIAgent这一应用载体成为了大家关注的热点,有望成为大模型落地应用的最佳形态。OpenAI的应用研究主管LilianWeng撰写了一篇博客,认为AIAgent可能会成为新时代的开端。她提出了Agent=LLM+规划技能+记忆+工具使用的基础架构,其中的“长期记忆”,即外挂知识库,则不可避免地需要使用到RAG技术。 图4:由LLM驱动的自主智能体系统的架构 数据来源:LilianWeng《LLMPoweredAutonomousAgents》,东方证券研究所 在11月6日的OpenAIDevDay上,OpenAI发布了AssistantAPI,帮助开发者快速构建AIAgent应用。Assistant是一种专门构建的AI,具有特定指令,利用额外的知识,并可以调用模型和工具来执行任务。在AssistantsAPI中,OpenAI专门提供了检索工具,用户可以上传外部知识文档,系统会自动对文档进行分块、存储和嵌入,并在后续的交互中采用向量搜索来进行检索增强生成。 图5:AssistantAPI功能图6:Assistant创建页面 数据来源:OpenAI,东方证券研究所数据来源:OpenAI,东方证券研究所 百度开放智能云千帆AppBuilder服务,人人都能开发AI原生应用。千帆AppBuilder主要由组件、框架两层服务构成。“组件”服务由多模态的AI能力组件(如文字识别、文生图等)、基于 大语言模型的能力组件(如长文总结、nl2sql等)、基础组件(如向量数据库、对象存储等)三部分组成,是对底层服务能力的组件化封装,让每个组件完成一个特定的功能。“框架”则是通过将上述这些组件有选择地串联、组合起来,让它们能够比较完整地完成一个特定场景的任务。目前,AppBuilder提供的检索增强生成(RAG)、智能体(Agent)、智能数据分析(GBI)就是常用的AI原生应用框架。Ap