您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[西部证券]:金融工程专题报告:量化多因子选股框架 - 发现报告
当前位置:首页/行业研究/报告详情/

金融工程专题报告:量化多因子选股框架

金融2024-09-04西部证券尊***
AI智能总结
查看更多
金融工程专题报告:量化多因子选股框架

证券研究报告 量化多因子选股框架 ——金融工程专题报告 西部证券研发中心 2024年9月4日 分析师|冯佳睿S0800524040008邮箱地址:fengjiarui@research.xbmail.com.cn 机密和专有 未经西部证券许可,任何对此资料的使用严格禁止 核心观点 •【核心结论】本报告详细介绍了量化多因子选股的流程与框架,涵盖因子预处理、评价及收益预测模型等关键步骤。 •【报告亮点】系统性整理了从因子测试、因子筛选到组合构建的全过程,为高效构建量化投资组合提供了清晰路径。 •【主要逻辑】 单因子测试 介绍单因子预处理的基本方法,主要包括去极值、标准化、中心化。 因子检验的评价维度和评价方式,其中评价方式主要有ICIR法、分组测试法、双变量排序法和回归法。 收益预测模型 对因子进行筛选,判断其是否能够纳入多因子组合。 用一系列筛选得到的因子预测个股收益,这一步本质可理解为多因子的聚合。常见方法可分为线性和非线性,其中线性法主要有加权和回归两种方式,非线性主要包括神经网络、树模型等。 组合构建 基于得到的个股收益预测,计算组合的净值曲线和收益风险特征。 组合构建的主要步骤包括设定选股池与调仓周期、以及确定选股逻辑和权重。其中,选股逻辑和权重一般基于人工逻辑直接构建得到,或者利用优化算法在更复杂的选股约束下进行求解。 我们基于上述框架,结合多因子复合打分构建了一个中证500指数增强策略,业绩表现优于基准。 •风险提示:数据来源第三方,或有遗漏、滞后、误差;选股研究框架及筛选指标为西部证券自建,或有考虑不周之处;股票历史业绩不代表未 来表现,研究框架也会随时间变化。 量化多因子选股基本框架 收益预测模型:通过历史估计给出股票未来的预期收益率。 风险管理模型:控制组合与业绩基准之间的跟踪误差。 组合权重优化:在给定的风险约束下,最大化组合的预期收益率。 图:多因子组合构建基本流程 收益预测 •因子筛选 •预测股票收益 风险管理 •预期跟踪误差 •组合风格偏离 •组合风险贡献 组合优化 •给定风险约束 •最大化预期收 益 01单因子测试 目录 ENTS 录 目 02 CONTENTS 03 收益预测模型组合构建 1单因子测试 1.1备选因子:基于原始指标或开发;挑选时需要注意因子是否直接、直观且有意义。 •直接(incisive):通过因子能够明确对股票进行分类。 •直观(intuitive):对股票的分类标准具有可以解释的逻辑性。 •有意义(interesting):分类后的股票风险收益特征具有明显差异。 表:确定备选因子的3个I 备选因子 Incisive Intuitive Interesting 首字母 ■ □ □ 公司地点 ■ ■ □ 股票盈利 ■ ■ ■ 参考文献:ActivePortfolioManagement,byGrinoldandKahn. 1单因子测试 1.2因子预处理 • 01 -去极值 • 02 -标准化 • 03 -中性化 1单因子测试 1.2因子预处理 •01-去极值:因子数据中的极端值会影响分析结果,离群值会扭曲因子与收益率之间的相关性估计。 去极值的基本逻辑:确定上下限,将超出范围的因子值修改为上下限。 常见的去极值方法有: ①MAD法:上下限为𝑥�±�∗𝐷𝑀𝐴𝐷,𝑥𝑀:序列𝑥�的中位数,𝐷𝑀𝐴𝐷:序列|𝑥𝑖-𝑥𝑀|的中位数 ②3�法:上下限为𝑥�±�∗𝜎,𝑥𝑀:序列𝑥�的均值,𝜎:序列𝑥�的标准差 ③百分位法:上限分位数和下限分位数(一般为97.5%和2.5%)。 1单因子测试 1.2因子预处理 •02-标准化:不同的因子数据往往具有不同的单位和数值范围,这种差异会导致数值较大的因子在分析中占据过大的比重,而数值较小的因子则会被相对削弱。因此,通常需要对这些因子数据进行标准化处理,以消除量纲的影响。 常见标准化方法有: ①Z-score ②Max-Min ③取对数 ④排序标准化 1单因子测试 1.2因子预处理 •03-中性化:剔除因子数据中显著的风险暴露,因为若使用具有明显风险暴露的因子值作为选股条件,会导致筛选出的股票集中在特定的风险暴露上。 中性化的基本逻辑:因子值作为y,风险因子作为x,进行线性回归,回归残差即为风险中性后的因子值。 常见中性化方法有: ①行业中性 ②市值中性 ③其他风险因子中性 1单因子测试 1.3因子检验 •因子的评价维度: 因子单调性:因子单调性越好,收益区分能力越强。 因子有效性:因子对未来收益的解释能力。 因子稳定性:因子的有效性是否稳定、可持续 因子时效性:在过去有效的因子,现在或将来不一定有效。 1单因子测试 1.3因子检验 •因子评价方式: 01-IC、IR:常用于评价因子有效性和稳定性。 02-分组测试:将股票按照因子值大小分组,统计每组在下一周期的收益。 03-双变量排序:计算控制因子1下的因子2分组收益,以防止排序受其他因子的干扰。 04-回归法:将T期的因子暴露与T+1期股票收益率进行线性回归。 1单因子测试 1.3因子检验 01-IC、IR:常用于评价因子有效性和稳定性。 Pearson相关系数(IC):当期因子值与下期股票收益之间的线性相关性。 Spearman相关系数(RankIC):当期因子与下期股票收益之间的序数相关性。 ICIR信息比率(ICInformationRatio):IC的均值与IC标准差之比,代表因子 获取稳定Alpha的能力。 1单因子测试 1.3因子检验 02-分组测试:将股票按照因子值大小分组,统计每组在下一周期的收益。 每组间的收益差异越大、单调性越明显,因子有效性越好。 图:PB因子分组月均收益(2018.01-2024.07) 0.8% 0.6% 0.4% 0.2% 0.0% -0.2% -0.4% -0.6% -0.8% G1G2G3G4G5G6G7G8G9G10 注:横轴为t月按照股票的PB从小到大等分成10组,纵轴代表每个PB组合t+1月收益的均值 1单因子测试 1.3因子检验 03-双变量排序:计算控制因子1下的因子2分组收益,以防止排序受其他因子的干扰。 (有条件)双变量排序流程: 1)按因子值1将股票分为10组。 2)在各因子值1分组中按因子值2分为10组。 3)将不同因子值1分组内相同因子值2排序分组的收益加总,得到控制因子值1下的因子值2的分组收益。 1单因子测试 1.3因子检验 04-回归法:将因子T期的因子暴露与T+1期股票收益率进行截面线性回归。 r𝑡+1=𝑋𝑡𝑓�+𝜀� 回归系数𝑓�:因子当期的收益率(因子溢价)。 因子收益率显著度水平(t-test):对于每一期的截面回归,都可以得到一个因子收益率𝑓�, 对于𝑓�序列进行�检验,以观察因子收益率序列的方向一致性。 目录 ENTS 01 02 录 目 02 CONTENTS 03 单因子测试收益预测模型组合构建 2收益预测模型 2.1单因子筛选:判断因子是否纳入多因子组合 •单因子筛选方式: 单因子有效性 因子间相关性 表:常见选股因子列表及其计算方式 因子 因子计算方式 风格 市值 log(总市值) 非线性市值 log(总市值)Z-score的平方 预期EP 一致预期净利润/总市值 行为 反转 前1个月累计收益率 换手率 前1个月日均换手率 波动率 Fama-French时间序列回归残差波动率 财务 ROE 单季度ROE SUE (净利润(t)-净利润(t-4))/过去4期净利润变化的波动率 2收益预测模型 2.2收益预测:用一系列个股因子预测个股收益,本质可理解为多因子的聚合 •𝑭𝒊:个股的一系列因子 𝝁ෝ�=𝒇(𝑭𝒊)�∗��∗�∗� 图:收益预测模型 风格 行为 财务 预期 行业 预期收益 •规模 •价值 •收益率 •换手率 •波动率 •… •盈利能力 •盈利增长 •… •目标收益 •分析师覆盖度 •… •行业轮动 2收益预测模型 2.2收益预测:用一系列个股因子预测个股收益,本质可理解为多因子的聚合 •因子聚合方式: 线性: 加权法:等权法、IC加权法、IC-IR加权法、IC半衰加权法。 回归法:通过因子收益率估计个股收益。 非线性:神经网络、树模型。 2收益预测模型 2.2收益预测 回归法:通过因子收益率估计个股收益𝝁ෝ。 T期股票收益率对因子T-1期的因子暴露进回归,得到因子收益率𝐹𝑡−1: r�=𝑋𝑡−1𝐹𝑡−1+𝜀𝑡−1 因子预期收益率𝖰෡𝒕+�一般采用过去12个月因子收益率𝐹�均值作为估计。 计算个股预期收益𝝁ෝ,即,个股最新因子暴露与因子预期收益率的乘积: 𝝁ෝ =𝑭�∙𝖰෡𝒕+� 2收益预测模型 2.2收益预测 神经网络:通过深度学习估计个股收益𝝁ෝ。 模型框架:循环神经网络(RNN)+全连接神经网络(NN) 金融数据的特征和RNN模型较为适配。 RNN提取金融时间序列中的信息,NN将RNN处理后的信息转化为收益预测。 图:深度学习预测个股收益流程图 个股因子时间序列 RNN NN 收益预测 2收益预测模型 2.3收益预测模型评价 •模型预测选股收益的IC、RankIC,绝对/相对胜率。 •预期收益多头组合(Top10%)相对市场等权组合的表现。 表:收益预测模型的选股收益表现示例(复合因子,2018.01-2024.07) IC RankIC 多头收益 空头收益 多空收益 月均值 2.4% 3.5% 0.8% -0.3% 1.0% 月胜率 54.9% 56.9% 52.9% 49.0% 57.8% 信息比 0.21 0.26 0.13 -0.04 0.22 注:复合因子为对市值、PB、SUE、ROE、动量因子等权打分。 目录 ENTS 01 录 目 02 CONTENTS 03 单因子测试收益预测模型组合构建 3组合构建 计算组合的净值曲线和收益风险特征 1.确定选股池 •基本池:沪深A股中,剔除ST股、上市不足3个月的股票以及停牌股。 •其他要求:如流动性要求(剔除选股池中过去1年日均总市值和成交额排名靠后20%的股票)。 2.确定调仓周期 •季频、月频、双周频、周频。 3.确定选股逻辑及权重,计算净值曲线 3组合构建 3.确定选股逻辑及权重 •人工逻辑 选股个数:基于收益预测选择top100、top10%的股票。 加权方式:等权、股息率加权、市值加权。 •组合优化 基于收益预测构建优化目标,如,最大化组合收益。 添加更复杂的选股约束。 选股个数及加权方式由优化器求解得到。 3组合构建 3.确定选股逻辑及权重 •组合优化——常用于指数增强 目标函数 最大化组合预期收益 约束条件 个股权重偏离、组合风格暴露 行业、市值等风险约束 换手率约束 𝐦𝐚�𝒘′𝝁ෝ � s.t.𝒘′�=𝟏,�≤�≤� �−𝒘� ′�≤� �−𝒘� ′𝕀[𝒊∈𝑫]=� � 求解最优化问题,得到股票权重。 ෍ 𝒊=� 𝒘𝒊,�−𝒘𝒊,𝒕−� ≤� 3组合构建 4.组合分析 风险收益指标 •累积收益、年化收益、超额收益、最大回撤、换手率、胜率 •信息比率IR、夏普比率、卡尔玛比率、索提诺比率 归因分析 •收益归因 •风险归因 3组合构建 基于复合因子构建中证500指数增强策略 •复合因子:对市值、