2026年04月13日 报告发布日期 SSPT:股票时序定制化预训练选股框架 ——量化研究参考系列之二一 刘静涵执业证书编号:S0860520080003香港证监会牌照:BSX840liujinghan@orientsec.com.cn021-63326320 研究结论 ⚫文献信息:本次分享的论文由爱丁堡大学(The University of Edinburgh)信息学院Mengyu Wang、Tiejun Ma、Shay B. Cohen联合撰写,于2025年8月发表于ACM SIGKDD国际会议(KDD 2025),标题为《Pre-training Time SeriesModels with Stock Data Customization》专为金融时序定制的预训练框架。 QuantaAlpha:用大模型做量化因子挖掘:——量化研究参考系列之一2026-04-07 ⚫推荐理由:论文针对股票价格序列高噪声、非平稳、结构信息利用不足等问题,提出股票定制化预训练框架SSPT。通过股票代码分类(SCC)、行业分类(SSC)和移动均值预测(MAP)三类任务,从个股差异、行业结构和趋势信息三个维度提取价格序列中的潜在特征,在不增加复杂模型结构的前提下,有效提升选股模型的表征能力与泛化能力。 ⚫核心框架:SSPT基于标准Transformer架构,构建“定制化预训练→参数迁移→选股微调”的一体化股票选股体系。1)数据构建:以滑动窗口方式对多股票价格序列切片,形成统一时序输入;2)预训练任务设计:设计股票代码分类(SCC)、行业分类(SSC)与移动均值预测(MAP)三类任务,从个股差异、行业结构与价格趋势三个维度提取价格序列中的潜在信息;3)多任务联合训练:在同一Transformer框架下,通过多任务加权损失进行联合优化,使模型在统一结构中同时学习个股特征、行业共性与时间序列趋势;4)选股微调:替换任务头,新增收益预测层,在下游选股任务中完成收益预测与排序决策。 ⚫亮点分析:对比我们在前期报告中提出的DFQ-Diversify模型,SSPT体现出四点核心增量:1)建模目标:从剥离环境扰动,拓展到先提升价格表征质量;2)核心机制:从对抗解耦训练,拓展到任务驱动的表征学习;3)训练流程:从单阶段收益建模,拓展为“预训练+微调”两阶段框架;4)信息处理:从显式过滤无效信息,拓展为通过定制化任务隐式学习有效结构;5)体系价值:推动量化选股由“特征构造驱动”向“表征学习驱动”范式升级。 ⚫实证结果:论文在NASDAQ、NYSE、TOPIX-100、FTSE-100及NASDAQ-recent五个市场上进行系统验证。从预训练任务层面看,SCC与SSC组合表现最为稳健,MAP能提升收益上限但对参数更敏感;从最终选股表现看,SSPT在多个市场上均显著优于市场基准及主流方法,其中SSPT-ind(单任务预训练)与SSPT-comb(多任务预训练)均取得领先表现,体现出较强的跨市场与跨周期泛化能力。 ⚫优化方向:结合A股市场特性与现有量化研究体系,提出以下优化方向:1)输入特征:从基础价量数据扩展至多维度因子体系,增强信息覆盖;2)预训练任务:从个股识别、行业结构与趋势平滑,拓展至更贴近交易逻辑的市场状态建模;3)训练机制:从多任务简单加权,升级为更稳定的任务协同优化框架,以缓解任务冲突、提升模型鲁棒性。 风险提示 1.量化模型基于历史数据分析,未来存在失效风险,建议投资者紧密跟踪模型表现。2.极端市场环境可能对模型效果造成剧烈冲击,导致收益亏损。 目录 1、文献信息:爱丁堡大学提出股票时序定制化预训练框架,发表于KDD 2025 2、推荐理由:股票定制化预训练框架,弥补金融时序结构挖掘不足.............4 3、核心框架:三类预训练任务驱动的一体化选股体系..................................5 3.1数据构建:滑动窗口切片构建统一时序输入.................................................................53.2预训练任务设计:三类任务协同提取股票时序多维特征...............................................53.3多任务联合训练:基于标准Transformer的多任务预训练,统一学习价格序列表征....73.4选股微调:在Transformer上增加收益预测头,实现从表征学习到选股决策的迁移....8 4、亮点分析:对比DFQ-Diversify,实现从“领域解耦”到“表征学习”的体系扩展 4.1建模目标:从“剥离环境扰动”到“提纯价格表征”............................................................94.2核心机制:从“对抗解耦训练”到“任务驱动表征学习”.....................................................94.3训练流程:从“直接建模收益”到“预训练+微调两阶段框架”..........................................94.4信息处理方式:从“显式剥离无效信息”到“隐式学习有效结构”.....................................104.5体系价值:从“特征构造驱动”到“表征学习驱动”的范式升级........................................10 5、实证结果:多市场验证预训练有效性,结构性任务显著提升选股表现....10 5.1论文实验设计与核心结论...........................................................................................105.2结果说明与可复现性...................................................................................................12 6、优化方向:从“定制化预训练”走向“更贴近实盘的表征学习体系”.............13 6.1输入特征:从基础价量数据扩展至多维度因子体系....................................................136.2预训练任务:从三类任务扩展至更贴近交易逻辑的状态建模......................................146.3多任务训练:从多任务简单加权走向更稳定的任务协同机制......................................14 7、风险提示...............................................................................................14 图表目录 图1:SSPT全流程解析:从股票定制化预训练到选股微调........................................................5图2:SCC任务示例:价格切片可用于识别个股身份,验证个股层面存在可学习的行为特征......6图3:SCC/SSC分类效果对比:价格序列中存在可识别的个股与行业特征.................................6图4:三类预训练任务的学习率敏感性分析:SCC/SSC偏好较高学习率,MAP偏好较低学习率7图5:不同微调策略下的选股表现对比:预训练任务有效,但最优迁移方式存在差异..................8图6:不同预训练任务组合的效果对比:多任务联合训练存在目标冲突,SCC+SSC更稳健.....11图7:不同预训练任务组合对应的Sharpe Ratio:SCC+SSC更稳健,MAP稳定性不足..........11图8:主基准市场选股结果对比:SSPT框架整体优于市场基准及主流方法..............................12图9:扩展市场结果对比:SSPT在FTSE-100与recent NASDAQ上仍能稳定跑赢市场.........12图10:模拟实验结果:SCC/SSC能够识别价格序列背后的统计属性差异................................13 量化投资行业前沿理论与技术迭代提速,海外顶尖量化研究成果中蕴藏着诸多可借鉴的新思路、新框架,为A股量化因子挖掘与策略研发提供重要参考。为此,我们推出量化研究参考系列报告,聚焦海外顶刊、预印本平台发布的量化领域前沿文献,通过深度拆解核心逻辑、实证结果与创新价值,结合A股市场特性及本土投研实践开展适配性分析,提炼可落地的优化方向与应用思路,为投资者提供专业、前沿的研究参考。本期为系列第二篇,重点解析专为金融时序定制的预训练框架,探讨定制化预训练在量化选股中的应用价值与实现路径。 1、文献信息:爱丁堡大学提出股票时序定制化预训练框架,发表于KDD 2025 本次分享的论文由爱丁堡大学(The University of Edinburgh)信息学院Mengyu Wang、Tiejun Ma、Shay B. Cohen联合撰写,于2025年8月发表于ACM SIGKDD国际会议(KDD2025),标题为《Pre-training Time Series Models with Stock Data Customization》专为金融时序定制的预训练框架。 2、推荐理由:股票定制化预训练框架,弥补金融时序结构挖掘不足 论文提出了一套面向股票价格序列的定制化预训练框架——SSPT(Stock SpecializedPre-trained Transformer)。通过设计股票代码分类、股票行业分类和移动均值预测三类预训练任务,从“个股属性—行业结构—价格趋势”三个维度系统性挖掘价格序列中的潜在统计特征,并结合标准Transformer架构完成预训练与选股微调的统一建模,实现了股票时序特征学习的结构化提升。该框架在多个主流市场数据集(NASDAQ、NYSE、TOPIX-100等)上取得显著效果:在NASDAQ数据集上,模型累计收益率(IRR)最高达0.82,Sharpe Ratio达2.25–2.32,显著优于市场基准(IRR 0.15,SR 1.53)及多类现有方法,在收益能力与风险调整收益指标上均表现领先。 当前基于深度学习的股票预测选股方法虽已取得一定进展,但在预训练层面仍存在明显不足,主流方法普遍存在以下痛点: 1.对比学习方法:通常依赖高频数据(如分钟级或秒级价格)构建多粒度对比视角,对数据要求较高,在实际应用中可获取性有限,难以推广至常规日频数据场景。2.掩码值预测方法:直接预测被遮蔽的价格点,但由于股票价格具有显著的非平稳性与高噪声特征,单点价格本身随机性较强,导致预测目标不稳定,从而限制模型对有效特征的提取能力。3.通用时间序列预训练方法迁移问题:现有方法多直接借鉴NLP或CV领域的预训练策略,缺乏对股票数据中个股差异、行业联动及市场结构信息的刻画,导致潜在统计信息利用不足。 针对上述问题,论文实现了针对股票数据特性的系统性改进:通过引入股票代码与行业分类任务,显式建模个股与板块层面的结构信息;通过移动均值预测替代单点值预测,降低噪声干扰、增强趋势特征提取能力;通过多任务预训练与下游选股任务的结合,使模型能够在保留通用时间序列建模能力的同时,更充分挖掘金融市场中的可预测结构。整体来看,该框架在不增加复杂模型结构的前提下,实现了对股票序列预训练范式的有效拓展,为基于表示学习的量化选股研究提供了新的技术路径。 3、核心框架:三类预训