行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

量化研究参考系列之二一：SSPT：股票时序定制化预训练选股框架

文化传媒 2026-04-13 东方证券起风了

文献信息

本次分享的论文由爱丁堡大学信息学院联合撰写，发表于 KDD 2025，标题为《Pre-training Time Series Models with Stock Data Customization》，提出股票定制化预训练框架 SSPT。

核心框架

SSPT 基于标准 Transformer 架构，构建“定制化预训练 → 参数迁移 → 选股微调”的一体化股票选股体系。 1）数据构建：以滑动窗口方式对多股票价格序列切片，形成统一时序输入； 2）预训练任务设计：设计股票代码分类（SCC）、行业分类（SSC）与移动均值预测（MAP）三类任务，从个股差异、行业结构与价格趋势三个维度提取价格序列中的潜在信息； 3）多任务联合训练：在同一 Transformer 框架下，通过多任务加权损失进行联合优化，使模型在统一结构中同时学习个股特征、行业共性与时间序列趋势； 4）选股微调：替换任务头，新增收益预测层，在下游选股任务中完成收益预测与排序决策。

亮点分析

对比前期 DFQ-Diversify 模型，SSPT 体现出四点核心增量： 1）建模目标：从剥离环境扰动，拓展到先提升价格表征质量； 2）核心机制：从对抗解耦训练，拓展到任务驱动的表征学习； 3）训练流程：从单阶段收益建模，拓展为“预训练 + 微调”两阶段框架； 4）信息处理：从显式过滤无效信息，拓展为通过定制化任务隐式学习有效结构； 5）体系价值：推动量化选股由“特征构造驱动”向“表征学习驱动”范式升级。

实证结果

论文在 NASDAQ、NYSE、TOPIX-100、FTSE-100 及 NASDAQ-recent 五个市场上进行系统验证。从预训练任务层面看，SCC 与 SSC 组合表现最为稳健，MAP 能提升收益上限但对参数更敏感；从最终选股表现看，SSPT 在多个市场上均显著优于市场基准及主流方法，其中 SSPT-ind（单任务预训练）与 SSPT-comb（多任务预训练）均取得领先表现，体现出较强的跨市场与跨周期泛化能力。

优化方向

结合 A 股市场特性与现有量化研究体系，提出以下优化方向： 1）输入特征：从基础价量数据扩展至多维度因子体系，增强信息覆盖； 2）预训练任务：从个股识别、行业结构与趋势平滑，拓展至更贴近交易逻辑的市场状态建模； 3）训练机制：从多任务简单加权，升级为更稳定的任务协同优化框架，以缓解任务冲突、提升模型鲁棒性。

风险提示

量化模型基于历史数据分析，未来存在失效风险，建议投资者紧密跟踪模型表现。
极端市场环境可能对模型效果造成剧烈冲击，导致收益亏损。

2026年04月13日报告发布日期 SSPT：股票时序定制化预训练选股框架 ——量化研究参考系列之二一刘静涵执业证书编号：S0860520080003香港证监会牌照：BSX840liujinghan@orientsec.com.cn021-63326320 研究结论 ⚫文献信息：本次分享的论文由爱丁堡大学（The University of Edinburgh）信息学院Mengyu Wang、Tiejun Ma、Shay B. Cohen联合撰写，于2025年8月发表于ACM SIGKDD国际会议（KDD 2025），标题为《Pre-training Time SeriesModels with Stock Data Customization》专为金融时序定制的预训练框架。 QuantaAlpha:用大模型做量化因子挖掘：——量化研究参考系列之一2026-04-07 ⚫推荐理由：论文针对股票价格序列高噪声、非平稳、结构信息利用不足等问题，提出股票定制化预训练框架SSPT。通过股票代码分类（SCC）、行业分类（SSC）和移动均值预测（MAP）三类任务，从个股差异、行业结构和趋势信息三个维度提取价格序列中的潜在特征，在不增加复杂模型结构的前提下，有效提升选股模型的表征能力与泛化能力。 ⚫核心框架：SSPT基于标准Transformer架构，构建“定制化预训练→参数迁移→选股微调”的一体化股票选股体系。1）数据构建：以滑动窗口方式对多股票价格序列切片，形成统一时序输入；2）预训练任务设计：设计股票代码分类（SCC）、行业分类（SSC）与移动均值预测（MAP）三类任务，从个股差异、行业结构与价格趋势三个维度提取价格序列中的潜在信息；3）多任务联合训练：在同一Transformer框架下，通过多任务加权损失进行联合优化，使模型在统一结构中同时学习个股特征、行业共性与时间序列趋势；4）选股微调：替换任务头，新增收益预测层，在下游选股任务中完成收益预测与排序决策。 ⚫亮点分析：对比我们在前期报告中提出的DFQ-Diversify模型，SSPT体现出四点核心增量：1）建模目标：从剥离环境扰动，拓展到先提升价格表征质量；2）核心机制：从对抗解耦训练，拓展到任务驱动的表征学习；3）训练流程：从单阶段收益建模，拓展为“预训练+微调”两阶段框架；4）信息处理：从显式过滤无效信息，拓展为通过定制化任务隐式学习有效结构；5）体系价值：推动量化选股由“特征构造驱动”向“表征学习驱动”范式升级。 ⚫实证结果：论文在NASDAQ、NYSE、TOPIX-100、FTSE-100及NASDAQ-recent五个市场上进行系统验证。从预训练任务层面看，SCC与SSC组合表现最为稳健，MAP能提升收益上限但对参数更敏感；从最终选股表现看，SSPT在多个市场上均显著优于市场基准及主流方法，其中SSPT-ind（单任务预训练）与SSPT-comb（多任务预训练）均取得领先表现，体现出较强的跨市场与跨周期泛化能力。 ⚫优化方向：结合A股市场特性与现有量化研究体系，提出以下优化方向：1）输入特征：从基础价量数据扩展至多维度因子体系，增强信息覆盖；2）预训练任务：从个股识别、行业结构与趋势平滑，拓展至更贴近交易逻辑的市场状态建模；3）训练机制：从多任务简单加权，升级为更稳定的任务协同优化框架，以缓解任务冲突、提升模型鲁棒性。风险提示 1.量化模型基于历史数据分析，未来存在失效风险，建议投资者紧密跟踪模型表现。2.极端市场环境可能对模型效果造成剧烈冲击，导致收益亏损。目录 1、文献信息：爱丁堡大学提出股票时序定制化预训练框架，发表于KDD 2025 2、推荐理由：股票定制化预训练框架，弥补金融时序结构挖掘不足.............4 3、核心框架：三类预训练任务驱动的一体化选股体系..................................5 3.1数据构建：滑动窗口切片构建统一时序输入.................................................................53.2预训练任务设计：三类任务协同提取股票时序多维特征...............................................53.3多任务联合训练：基于标准Transformer的多任务预训练，统一学习价格序列表征....73.4选股微调：在Transformer上增加收益预测头，实现从表征学习到选股决策的迁移....8 4、亮点分析：对比DFQ-Diversify，实现从“领域解耦”到“表征学习”的体系扩展 4.1建模目标：从“剥离环境扰动”到“提纯价格表征”............................................................94.2核心机制：从“对抗解耦训练”到“任务驱动表征学习”.....................................................94.3训练流程：从“直接建模收益”到“预训练+微调两阶段框架”..........................................94.4信息处理方式：从“显式剥离无效信息”到“隐式学习有效结构”.....................................104.5体系价值：从“特征构造驱动”到“表征学习驱动”的范式升级........................................10 5、实证结果：多市场验证预训练有效性，结构性任务显著提升选股表现....10 5.1论文实验设计与核心结论...........................................................................................105.2结果说明与可复现性...................................................................................................12 6、优化方向：从“定制化预训练”走向“更贴近实盘的表征学习体系”.............13 6.1输入特征：从基础价量数据扩展至多维度因子体系....................................................136.2预训练任务：从三类任务扩展至更贴近交易逻辑的状态建模......................................146.3多任务训练：从多任务简单加权走向更稳定的任务协同机制......................................14 7、风险提示...............................................................................................14 图表目录图1：SSPT全流程解析：从股票定制化预训练到选股微调........................................................5图2：SCC任务示例：价格切片可用于识别个股身份，验证个股层面存在可学习的行为特征......6图3：SCC/SSC分类效果对比：价格序列中存在可识别的个股与行业特征.................................6图4：三类预训练任务的学习率敏感性分析：SCC/SSC偏好较高学习率，MAP偏好较低学习率7图5：不同微调策略下的选股表现对比：预训练任务有效，但最优迁移方式存在差异..................8图6：不同预训练任务组合的效果对比：多任务联合训练存在目标冲突，SCC+SSC更稳健.....11图7：不同预训练任务组合对应的Sharpe Ratio：SCC+SSC更稳健，MAP稳定性不足..........11图8：主基准市场选股结果对比：SSPT框架整体优于市场基准及主流方法..............................12图9：扩展市场结果对比：SSPT在FTSE-100与recent NASDAQ上仍能稳定跑赢市场.........12图10：模拟实验结果：SCC/SSC能够识别价格序列背后的统计属性差异................................13 量化投资行业前沿理论与技术迭代提速，海外顶尖量化研究成果中蕴藏着诸多可借鉴的新思路、新框架，为A股量化因子挖掘与策略研发提供重要参考。为此，我们推出量化研究参考系列报告，聚焦海外顶刊、预印本平台发布的量化领域前沿文献，通过深度拆解核心逻辑、实证结果与创新价值，结合A股市场特性及本土投研实践开展适配性分析，提炼可落地的优化方向与应用思路，为投资者提供专业、前沿的研究参考。本期为系列第二篇，重点解析专为金融时序定制的预训练框架，探讨定制化预训练在量化选股中的应用价值与实现路径。 1、文献信息：爱丁堡大学提出股票时序定制化预训练框架，发表于KDD 2025 本次分享的论文由爱丁堡大学（The University of Edinburgh）信息学院Mengyu Wang、Tiejun Ma、Shay B. Cohen联合撰写，于2025年8月发表于ACM SIGKDD国际会议（KDD2025），标题为《Pre-training Time Series Models with Stock Data Customization》专为金融时序定制的预训练框架。 2、推荐理由：股票定制化预训练框架，弥补金融时序结构挖掘不足论文提出了一套面向股票价格序列的定制化预训练框架——SSPT（Stock SpecializedPre-trained Transformer）。通过设计股票代码分类、股票行业分类和移动均值预测三类预训练任务，从“个股属性—行业结构—价格趋势”三个维度系统性挖掘价格序列中的潜在统计特征，并结合标准Transformer架构完成预训练与选股微调的统一建模，实现了股票时序特征学习的结构化提升。该框架在多个主流市场数据集（NASDAQ、NYSE、TOPIX-100等）上取得显著效果：在NASDAQ数据集上，模型累计收益率（IRR）最高达0.82，Sharpe Ratio达2.25–2.32，显著优于市场基准（IRR 0.15，SR 1.53）及多类现有方法，在收益能力与风险调整收益指标上均表现领先。当前基于深度学习的股票预测选股方法虽已取得一定进展，但在预训练层面仍存在明显不足，主流方法普遍存在以下痛点： 1.对比学习方法：通常依赖高频数据（如分钟级或秒级价格）构建多粒度对比视角，对数据要求较高，在实际应用中可获取性有限，难以推广至常规日频数据场景。2.掩码值预测方法：直接预测被遮蔽的价格点，但由于股票价格具有显著的非平稳性与高噪声特征，单点价格本身随机性较强，导致预测目标不稳定，从而限制模型对有效特征的提取能力。3.通用时间序列预训练方法迁移问题：现有方法多直接借鉴NLP或CV领域的预训练策略，缺乏对股票数据中个股差异、行业联动及市场结构信息的刻画，导致潜在统计信息利用不足。针对上述问题，论文实现了针对股票数据特性的系统性改进：通过引入股票代码与行业分类任务，显式建模个股与板块层面的结构信息；通过移动均值预测替代单点值预测，降低噪声干扰、增强趋势特征提取能力；通过多任务预训练与下游选股任务的结合，使模型能够在保留通用时间序列建模能力的同时，更充分挖掘金融市场中的可预测结构。整体来看，该框架在不增加复杂模型结构的前提下，实现了对股票序列预训练范式的有效拓展，为基于表示学习的量化选股研究提供了新的技术路径。 3、核心框架：三类预训

点击免费查看完整报告

量化研究参考系列之二一：SSPT：股票时序定制化预训练选股框架

文献信息

推荐理由

核心框架

亮点分析

实证结果

优化方向

风险提示

你可能感兴趣

量化研究参考系列之五：Kronos：基于K线预训练的金融基础模型

因子选股系列之八十三：多模型学习量价时序特征

因子选股系列之一一六：NeuralODE：时序动力系统重构下深度学习因子挖掘模型

东方金工因子选股系列研究之九：日内残差高阶矩与股票收益

因子选股系列研究之六十：基于量价关系度量股票的买卖压力

量化选股系列研究之四：盈利因子的有效性及择时

因子选股系列研究之七：投机、交易行为与股票收益（下）

《因子选股系列研究之七十五》：适用A股不同股票池的统计风险模型

量化研究系列报告之二十：上市板块差异性视角下的选股策略优化与实战指南

因子选股系列之九十四：UMR2.0—风险溢价视角下的动量反转统一框架再升级