AI智能总结
——金融工程专题报告 西部证券研发中心 2024年9月4日 分析师|冯佳睿S0800524040008邮箱地址:fengjiarui@research.xbmail.com.cn 核心观点核心观点 •【核心结论】本报告详细介绍了量化多因子选股的流程与框架,涵盖因子预处理、评价及收益预测模型等关键步骤。 •【报告亮点】系统性整理了从因子测试、因子筛选到组合构建的全过程,为高效构建量化投资组合提供了清晰路径。 •【主要逻辑】 ➢单因子测试 ✓介绍单因子预处理的基本方法,主要包括去极值、标准化、中心化。✓因子检验的评价维度和评价方式,其中评价方式主要有ICIR法、分组测试法、双变量排序法和回归法。 ➢收益预测模型 ✓对因子进行筛选,判断其是否能够纳入多因子组合。✓用一系列筛选得到的因子预测个股收益,这一步本质可理解为多因子的聚合。常见方法可分为线性和非线性,其中线性法主要有加权和回归两种方式,非线性主要包括神经网络、树模型等。 ➢组合构建 ✓组合构建的主要步骤包括设定选股池与调仓周期、以及确定选股逻辑和权重。其中,选股逻辑和权重一般基于人工逻辑直接构建得到,或者利用优化算法在更复杂的选股约束下进行求解。✓我们基于上述框架,结合多因子复合打分构建了一个中证500指数增强策略,业绩表现优于基准。 •风险提示:数据来源第三方,或有遗漏、滞后、误差;选股研究框架及筛选指标为西部证券自建,或有考虑不周之处;股票历史业绩不代表未来表现,研究框架也会随时间变化。 量化多因子选股基本框架量化多因子选股基本框架 ➢收益预测模型:通过历史估计给出股票未来的预期收益率。 ➢风险管理模型:控制组合与业绩基准之间的跟踪误差。 ➢组合权重优化:在给定的风险约束下,最大化组合的预期收益率。 01单因子测试 CONTENTS目录CONTENTS目录 收益预测模型02 组合构建03 11单因子测试单因子测试 ➢1.1备选因子:基于原始指标或开发;挑选时需要注意因子是否直接、直观且有意义。 •直接(incisive):通过因子能够明确对股票进行分类。•直观(intuitive):对股票的分类标准具有可以解释的逻辑性。•有意义(interesting):分类后的股票风险收益特征具有明显差异。 11单因子测试单因子测试 ➢1.2因子预处理 •01-去极值•02-标准化•03-中性化 11单因子测试单因子测试 ➢1.2因子预处理 去极值的基本逻辑:确定上下限,将超出范围的因子值修改为上下限。 ①MAD法:上下限为𝑥𝑀±𝑛∗𝐷𝑀𝐴𝐷,𝑥𝑀:序列𝑥𝑖的中位数,𝐷𝑀𝐴𝐷:序列|𝑥𝑖-𝑥𝑀|的中位数②3𝜎法:上下限为𝑥𝑀±𝑛∗𝜎,𝑥𝑀:序列𝑥𝑖的均值,𝜎:序列𝑥𝑖的标准差③百分位法:上限分位数和下限分位数(一般为97.5%和2.5%)。 11单因子测试单因子测试 ➢1.2因子预处理 •02-标准化:不同的因子数据往往具有不同的单位和数值范围,这种差异会导致数值较大的因子在分析中占据过大的比重,而数值较小的因子则会被相对削弱。因此,通常需要对这些因子数据进行标准化处理,以消除量纲的影响。 ✓常见标准化方法有: ①Z-score②Max-Min③取对数④排序标准化 11单因子测试单因子测试 ➢1.2因子预处理 •03-中性化:剔除因子数据中显著的风险暴露,因为若使用具有明显风险暴露的因子值作为选股条件,会导致筛选出的股票集中在特定的风险暴露上。 ✓中性化的基本逻辑:因子值作为y,风险因子作为x,进行线性回归,回归残差即为风险中性后的因子值。 ①行业中性②市值中性③其他风险因子中性 11单因子测试单因子测试 ➢1.3因子检验 •因子的评价维度: ✓因子单调性:因子单调性越好,收益区分能力越强。✓因子有效性:因子对未来收益的解释能力。✓因子稳定性:因子的有效性是否稳定、可持续✓因子时效性:在过去有效的因子,现在或将来不一定有效。 11单因子测试单因子测试 ➢1.3因子检验 •因子评价方式: ✓01-IC、IR:常用于评价因子有效性和稳定性。✓02-分组测试:将股票按照因子值大小分组,统计每组在下一周期的收益。✓03-双变量排序:计算控制因子1下的因子2分组收益,以防止排序受其他因子的干扰。✓04-回归法:将T期的因子暴露与T+1期股票收益率进行线性回归。 11单因子测试单因子测试 ➢1.3因子检验 01-IC、IR:常用于评价因子有效性和稳定性。 ◆Pearson相关系数(IC):当期因子值与下期股票收益之间的线性相关性。◆Spearman相关系数(RankIC):当期因子与下期股票收益之间的序数相关性。◆ICIR信息比率(IC Information Ratio):IC的均值与IC标准差之比,代表因子获取稳定Alpha的能力。 ➢1.3因子检验 02-分组测试:将股票按照因子值大小分组,统计每组在下一周期的收益。 每组间的收益差异越大、单调性越明显,因子有效性越好。 11单因子测试单因子测试 ➢1.3因子检验 03-双变量排序:计算控制因子1下的因子2分组收益,以防止排序受其他因子的干扰。 (有条件)双变量排序流程: 1)按因子值1将股票分为10组。2)在各因子值1分组中按因子值2分为10组。3)将不同因子值1分组内相同因子值2排序分组的收益加总,得到控制因子值1下的因子值2的分组收益。 11单因子测试单因子测试 ➢1.3因子检验 04-回归法:将因子T期的因子暴露与T+1期股票收益率进行截面线性回归。 回归系数𝑓𝑡:因子当期的收益率(因子溢价)。 ◆因子收益率显著度水平(t-test):对于每一期的截面回归,都可以得到一个因子收益率𝑓𝑡,对于𝑓𝑡序列进行𝑡检验,以观察因子收益率序列的方向一致性。 CONTENTS目录CONTENTS目录 收益预测模型0202 22收益预测模型收益预测模型 ➢2.1单因子筛选:判断因子是否纳入多因子组合 •单因子筛选方式: ◆单因子有效性◆因子间相关性 22收益预测模型收益预测模型 ➢2.2收益预测:用一系列个股因子预测个股收益,本质可理解为多因子的聚合 •𝑭𝒊:个股的一系列因子 22收益预测模型收益预测模型 ➢2.2收益预测:用一系列个股因子预测个股收益,本质可理解为多因子的聚合 •因子聚合方式: 线性: ✓加权法:等权法、IC加权法、IC-IR加权法、IC半衰加权法。✓回归法:通过因子收益率估计个股收益。 ◆非线性:神经网络、树模型。 22收益预测模型收益预测模型 ➢2.2收益预测 回归法:通过因子收益率估计个股收益ෝ𝝁。 ✓T期股票收益率对因子T-1期的因子暴露进回归,得到因子收益率𝐹𝑡−1: ✓因子预期收益率𝜷𝒕+𝟏一般采用过去12个月因子收益率𝐹𝑡均值作为估计。 ✓计算个股预期收益ෝ𝝁,即,个股最新因子暴露与因子预期收益率的乘积: 22收益预测模型收益预测模型 ➢2.2收益预测 神经网络:通过深度学习估计个股收益ෝ𝝁。 ✓模型框架:循环神经网络(RNN)+全连接神经网络(NN)✓金融数据的特征和RNN模型较为适配。✓RNN提取金融时间序列中的信息,NN将RNN处理后的信息转化为收益预测。 22收益预测模型收益预测模型 ➢2.3收益预测模型评价 •模型预测选股收益的IC、RankIC,绝对/相对胜率。 •预期收益多头组合(Top10%)相对市场等权组合的表现。 01 CONTENTS目录CONTENTS目录 收益预测模型02 03 33组合构建组合构建 ➢计算组合的净值曲线和收益风险特征 1.确定选股池 •基本池:沪深A股中,剔除ST股、上市不足3个月的股票以及停牌股。•其他要求:如流动性要求(剔除选股池中过去1年日均总市值和成交额排名靠后20%的股票)。 2.确定调仓周期 •季频、月频、双周频、周频。 3.确定选股逻辑及权重,计算净值曲线 33组合构建组合构建 3.确定选股逻辑及权重 •人工逻辑 ✓选股个数:基于收益预测选择top100、top10%的股票。 ✓加权方式:等权、股息率加权、市值加权。 •组合优化 ✓基于收益预测构建优化目标,如,最大化组合收益。✓添加更复杂的选股约束。✓选股个数及加权方式由优化器求解得到。 33组合构建组合构建 3.确定选股逻辑及权重 •组合优化——常用于指数增强 𝐦𝐚𝐱𝒘𝒘′ෝ𝝁 ◆目标函数✓最大化组合预期收益 s.t.𝒘′𝒆=𝟏,𝒍≤𝒘≤𝒖𝒘−𝒘𝑩′𝑭≤𝒙𝒘−𝒘𝑩′𝕀{𝒊∈𝑫}=𝟎𝒊=𝟏𝑵𝒘𝒊,𝒕−𝒘𝒊,𝒕−𝟏≤𝒚 约束条件 ✓个股权重偏离、组合风格暴露✓行业、市值等风险约束✓换手率约束 ◆求解最优化问题,得到股票权重。 33组合构建组合构建 4.组合分析 ✓风险收益指标 •累积收益、年化收益、超额收益、最大回撤、换手率、胜率•信息比率IR、夏普比率、卡尔玛比率、索提诺比率 ✓归因分析 •收益归因•风险归因 33组合构建组合构建 ➢基于复合因子构建中证500指数增强策略 复合因子:对市值、PB、SUE、ROE、动量因子等权打分。 •选股池:沪深A股中,剔除ST股。 •调仓周期:年频。 •增强组合优化约束构建: ✓个股权重:个股上限2%,个股偏离±2%;✓组合风格暴露:市值、PE偏离±0.5。✓行业约束:行业偏离±10%。✓换手率约束:单边换手率上限30%。 33组合构建组合构建 ➢基于复合因子构建中证500指数增强策略 •增强组合年化收益3.63%,相对中证500年化超额收益7.47%。 风险提示风险提示 1、本报告分析所用数据、信息均基于公开信息,第三方平台等,数据或有遗漏、误差、滞后; 2、各类型选股研究框架为西部证券自建,涉及权重数据或者划分标准均为西部证券制定,或有考虑不周之处,或随着市场变化不断完善; 3、股票历史业绩不代表未来表现,分析框架亦会随着市场变化有所变化,不构成投资建议,投资需谨慎。 投资评级说明投资评级说明 分析师声明 本人具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师,以勤勉的职业态度、专业审慎的研究方法,使用合法合规的信息,独立、客观地出具本报告。本报告清晰准确地反映了本人的研究观点。本人不曾因,不因,也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。 联系地址 联系地址:上海市浦东新区耀体路276号12层北京市西城区月坛南街59号新华大厦303深圳市福田区深南大道6008号深圳特区报业大厦10C 联系电话:021-38584209 免责声明免责声明 本报告由西部证券股份有限公司(已具备中国证监会批复的证券投资咨询业务资格)制作。本报告仅供西部证券股份有限公司(以下简称“本公司”)机构客户使用。本报告在未经本公司公开披露或者同意披露前,系本公司机密材料,如非收件人(或收到的电子邮件含错误信息),请立即通知发件人,及时删除该邮件及所附报告并予以保密。发送本报告的电子邮件可能含有保密信息、版权专有信息或私人信息,未经授权者请勿针对邮件内容进行任何更改或以任何方式传播、复制、转发或以其他任何形式使用,发件人保留与该邮件相关的一切权利。同时本公司无法保证互联网传送本报告的及时、安全、无遗漏、无错误或无病毒,敬请谅解。 本报告基于已公开的信息编制,但本公司对该等信息的真实性、准确性及完整性不作任何保证。本报告所载的意见、评估及预测仅为本报告出具日的观点和判断,该等意见、评估及预测在出具日外无需通知即可随时更改。在不同时期,本公司可能会发出与本报告所载意见、评估及预测不一致的研究报告。同时,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。本公司不保证本报告所含