您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国金证券]:金融工程2025年度策略:LLM破局Alpha困境,拥抱Beta大时代 - 发现报告
当前位置:首页/其他报告/报告详情/

金融工程2025年度策略:LLM破局Alpha困境,拥抱Beta大时代

2024-11-23高智威、赵妍、许坤圣、王小康国金证券邓***
金融工程2025年度策略:LLM破局Alpha困境,拥抱Beta大时代

展望2025年,我们认为交互式多模态大语言模型将会成为主流,满足更多样的使用需求,开拓更为丰富的应用场景。未来强化学习和“思维链”技术的运用将会是智能提升的主要方法,会显著提升模型在长线程思维问题的表现。在训练数据方面,虽目前还没触及理论上限,但在不远的将来,数据量的不足可能会成为大模型发展的主要限制。此外,我们预测端侧小模型将会有更广泛的应用场景,伴随大模型响应速度的提升、交互能力的增强,我们判断未来将有大量相关应用快速落地。大模型可以为主动投研赋能,提升工作效率,还可以生成投资决策,协助搭建投资策略。 近年来,FOF基金经理对基金优选的重视程度有所下降,ETF在FOF投资组合中的占比逐步提高。在主动管理产品Alpha趋弱的大背景下,ETF凭借显著的费率优势,展现出更高的投资价值。基于对结构性行情及风格切换可能性的预期,建议采用核心+卫星的投资组合策略:核心仓位可选择更均衡的中证A500ETF及具备风格轮动能力的主动权益基金作为底层配置;卫星仓位则建议使用交易成本低、灵活性高且满仓的ETF,以捕捉行业和风格的投资机会。大模型也能从定性和定量两个角度,有效识别风格轮动型基金,为投资决策提供支持。 从经济增长和通胀水平来看,目前市场仍然处于弱复苏的阶段,内需增速整体偏缓,美国的补库行为推动了出口的超预期强劲,明年外需增速或将降低。在择时方面,宏观择时策略建议切换至全仓进出模式,提升仓位比例,并且建议择时模块当中增加市场情绪指标提升信息维度;在风格方面,随着市场预期回暖,未来一年市场风格预期往高弹性的小盘及成长风格进行切换,但如出现不及预期情况,推荐短期切换回红利及微盘板块进行防御性配置。在行业方面,随着市场预期回暖,未来一年推荐关注分析师预期以及超预期因子。 在选股方面,我们认为中小盘宽基指数增强产品仍具备一定Alpha空间。AI模型的归因分析表明,这类产品更多暴露在低波动性和非流动性因子上,在剥离了Barra风格后,大盘股票池近年来已难以获取超额收益。因此,建议明年适度向成长风格倾斜。未来量化选股产品主要突破方向在于:更严格的风格控制或结合市场环境的风格主动暴露、更精细化的训练方式、更深层次的特征挖掘、和将强化学习等方式应用到组合优化上。此外,相较于传统的NLP模型,LLM拥有更强的信息提取能力和逻辑判断能力,在情感分析之外提供更深层次的判断,有助于构建更优异的另类舆情因子。 1、以上结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时存在失效的风险。 2、市场环境发生变化,国际政治摩擦升级等带来各大类资产同向大幅波动风险。 3、政策环境发生变化,资产与相关风险因子失去稳定关系的模型风险。 4、大语言模型具有一定的随机性,在部分情况下可能回答错误,不符合用户需求与认知,并影响到用户判断。 内容目录 一、大模型加速迭代,开启智能投研新纪元5 1.1交互型多模态大模型将成为主流5 1.2强化学习是模型智能提升的主要方法6 1.3训练数据是模型长期发展的关键7 1.4端侧小模型发展加速7 1.5模型应用展望8 1.6主动投研赋能9 1.7投资决策生成10 二、2025年权益基金投资展望:拥抱Beta的时代来临12 2.1FOF基金经理关注点变化:对基金优选关注度减弱12 2.2结构性行情下的核心+卫星策略——主动基金+ETF13 2.3核心底仓配置思路:均衡风格ETF+风格轮动型主动基金13 2.4卫星仓位配置:高度灵活的ETF16 三、2025年资产配置年度策略展望:宏观择时、风格配置与行业配置18 3.1目前宏观状态及宏观一致预期18 3.2宏观择时策略展望21 3.3风格配置22 3.4行业配置24 四、2025年因子选股展望:AI选股模型收益会持续吗?25 4.1中小盘宽基指增仍有Alpha空间25 4.2关注A500指数中沪深300以外成分股的Alpha29 4.3AI模型的失效与应对30 五、总结33 六、风险提示33 图表目录 图表1:多模态信息源与模态分类5 图表2:Gemini1.0模型架构概览6 图表3:o1模型在解决长程思维问题方面能力突出6 图表4:人类生成数据集将在模型训练中耗尽7 图表5:Gemini系列模型表现对比8 图表6:FigureAI人形机器人运行逻辑9 图表7:大模型在金融投资领域的应用预判9 图表8:大模型汇总卖方策略团队观点流程图10 图表9:投资概念上下游图谱示例11 图表10:投资概念相关标的结果示例11 图表11:基于ChatGPT的研究框架体系12 图表12:近年FOF基金经理对基金优选关注度持续下降13 图表13:ETF在FOF投资组合中占比变化13 图表14:结构性行情下FOF权益资产推荐配置框架13 图表15:全市场均衡配置基金Alpha中位数变化14 图表16:全市场均衡配置基金主动轮动程度及轮动收益15 图表17:主动轮动型基金优选组合与Alpha选基策略超额净值15 图表18:定性+定量的风格轮动型基金识别15 图表19:宽基指数成分股市值分布16 图表20:中证A500相对沪深300超配、低配Top5行业16 图表21:非货币ETF总规模和数量显著增加16 图表22:ETF市值占开放式基金市值比持续提高16 图表23:非货币ETF交易活跃度持续提升(亿元)17 图表24:ETF种类丰富,满足配置需求17 图表25:基金具有费率优势17 图表26:自上而下的人工智能ETF轮动策略构建框架17 图表27:人工智能ETF轮动策略长期跑赢沪深300指数18 图表28:2024年处于经济增长期(%)19 图表29:上下游通胀处于触底回升阶段(%)19 图表30:今年出口强劲(%)19 图表31:美国补库乏力(%)19 图表32:边际增长内需偏弱(M1)(%)20 图表33:社零回暖(%)20 图表34:2025年市场宏观一致预期20 图表35:宏观权益择时策略净值走势21 图表36:宏观权益择时策略逐年表现21 图表37:2018-2020年宏观权益择时策略仓位以及超额净值走势21 图表38:重构后股票择时策略净值走势22 图表39:重构后股票择时策略仓位22 图表40:大小盘差额净值与地产开发投资完成额累计同比(%)22 图表41:大小盘差额净值与M1同比(%)22 图表42:国证成长价值差额净值与M1M2剪刀差走势(%)23 图表43:国证成长价值差额净值与美债利率走势(%)23 图表44:茅指数与微盘股和红利指数差额净值以及中采制造业PMI走势(%)23 图表45:茅指数与微盘股和红利指数差额净值以及微盘股与红利指数差额净值走势23 图表46:弱势市场建议混合持仓红利和微盘板块降低波动24 图表47:行业轮动大类因子多空收益表现24 图表48:行业轮动大类因子今年以来表现24 图表49:盈利因子多空净值同比与大小盘差额净值走势25 图表50:估值动量多空净值与中证红利超额净值走势25 图表51:分析师预期、超预期因子多空净值与Wind全A净值走势25 图表52:沪深300公募指增超额统计(2024年截至11月7日)26 图表53:中证500公募指增超额统计(2024年截至11月7日)26 图表54:中证1000公募指增超额统计(2024年截至11月7日)26 图表55:各主流宽基指数公募指增超额收益率中位数统计26 图表56:今年以来沪深300指增Barra因子暴露分布27 图表57:今年以来中证500指增Barra因子暴露分布27 图表58:今年以来中证1000指增Barra因子暴露分布27 图表59:沪深300公募指增Barra因子暴露平均水平变化28 图表60:中证500公募指增Barra因子暴露平均水平变化28 图表61:中证1000公募指增Barra因子暴露平均水平变化28 图表62:各宽基指数成分股分析师覆盖程度29 图表63:各宽基指数多空收益“理论极限”29 图表64:各传统宽基指数在中证A500成分股的分布情况29 图表65:A500中沪深300外成分股等权组合净值30 图表66:2023年以来沪深300、中证500、中证1000的GBDT+NN指增因子多空收益净值30 图表67:2023年以来残差波动率、非流动性、20日换手率因子多空收益净值30 图表68:AI因子Barra风格因子暴露均值31 图表69:沪深300AI因子及剥离Barra后多头超额净值31 图表70:中证500AI因子及剥离Barra后多头超额净值31 图表71:中证1000AI因子及剥离Barra后多头超额净值31 图表72:LGBM与GRU在不同股票池训练下因子多空收益净值对比(沪深300)32 图表73:量化选股使用数据发展路径32 当前,大模型头部格局已基本确定,技术迭代速度逐步放慢。海外的闭源大模型已经形成以ChatGPT模型为首,Gemini、Claude等模型紧随的格局,开源模型方向则是以Llama系列最为突出,此外也有部分模型能在一些差异化应用场景中表现突出,各厂商均有代表性的模型产品。开源闭源模型差距逐步缩小。同时为了适配终端算力受限的场景,小参数模型也在快速发展。展望2025年,我们认为大模型层面将有以下发展趋势: 1.1交互型多模态大模型将成为主流 多模态指文字、音频、视频等不同模态的输入信息可以在同一个模型中得到反馈;而交互型则是对大模型的响应速度做出更高要求。多个模态之间信息可以起到互补作用,多模态的互动更贴合人类实际交流方式。因此这类模型能满足更多样的使用需求,开拓更丰富的大模型应用场景,加速大模型在各类场景中的应用落地。 图表1:多模态信息源与模态分类 来源:《AI终端白皮书》,华为,国金证券研究所 在GPT-4o模型之前,我们想要通过大模型实现语音对话功能实际上需要多个步骤,即从音频中识别文字输入大模型,得到回答后再由文本转回音频。这一过程实际会损失大量信息,包括语气、音调等,此外图像、视频中包含的丰富信息也无法有效使用。GPT-4o模型将图像、文字、语音等模态的训练集成到同一个神经网络中,是实现原生多模态的大模型。这类模型能够捕捉相同对象在不同模态中的相似特征,并在生成时能以指定的模态进行输出。 交互型大模型要求模型能做到极低延迟,能实现人类正常对话式的相应速度。GPT-4o在低延时的基础上,还能实现对话的随时打断,更贴近人类真实对话场景,实际上这得益于端到端架构与流式输入模式的结合。大模型能在用户输入的过程中就准备回应,对用户的暂停进行实时反馈,使交流更加流畅。 除了GPT-4o之外,Google的PaLM-E、Gemini与Meta的Chameleon等也是原生多模态模型,均能将不同模态的输入通过整合输入同一个Transformer模型中,而不需要单独的图像或文本编码器。 图表2:Gemini1.0模型架构概览 来源:《Gemini:AFamilyofHighlyCapableMultimodalModels》,Google,国金证券研究所 国内方面,目前大模型产品也在迅速跟进多模态方面的功能,例如商汤的日日新5o、智谱清言等也已实现类似的多模态实时交互能力,此外如豆包、通义千问大模型应用还只能实现音频通话,底层也是基于语音转文字后再得到反馈再以语音输出的形式,交互流畅性上较一般。因此,国内大模型在多模态交互方面将有较多发展。 1.2强化学习是模型智能提升的主要方法 OpenAI于2024年9月推出的o1模型通过模仿人类的思维过程,实现了在定理推导、代码撰写等专业领域推理能力的显著增强,其中使用到的就是强化学习与“思维链”技术。具体而言,OpenAI通过强化学习帮助o1模型学会生成更加准确的思维链,对高质量思维链的使用也能显著提升模型在长程思维问题方面的表现。 图表3:o1模型在解决长程思维问题方面能力突出 来源:OpenAI,国金证券研究所 这实现了Self-playRL的训练模式,类似于围棋领域深度学习模型AlphaGo向AlphaZero