您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:数量化投资技术系列之三十一:行业内区分度动量选股探讨 - 发现报告
当前位置:首页/其他报告/报告详情/

数量化投资技术系列之三十一:行业内区分度动量选股探讨

2010-09-13董艺婷国信证券花***
数量化投资技术系列之三十一:行业内区分度动量选股探讨

行业内区分度动量选股2010年9月10日成都分析师董艺婷SAC执业证书编号:S0980210030026联系人程景佳 目录行业内区分度动量选股策略4基于因子贡献度的行业分析3行业内量化选股的挑战25思考与后续研究背景回顾1 1.1 因子贡献度定义股票池TOPBOTTOM因子分布两端的收益差股票池TOPBOTTOM收益分布两端的收益差因子排序收益排序贡献度 1.2 因子贡献度公式[ ][][ ][] low Fhigh Fhigh Rlow Rlow Fhigh Fhigh Rlow Riji SETj SETFiji SETj SETiji SETj SETiji SETj SETmean Rmean RCONmean Rmean RRRRR 1.3 因子打分模型与半衰期选股策略( )( , ) *( )tttFSCORE irank F i CON FTOPBOTTOMTOPBOTTOM新组合因子贡献度是对客观历史的真实反映,不涉及统计规律区分度动量假设因子具有动量效应,去跟踪市场受关注的因子,不需要去预测因子或者市场走势。 目录行业内区分度动量选股策略4基于因子贡献度的行业分析315行业内量化选股的挑战2背景回顾思考与后续研究 2.1 全市场量化选股的延伸-行业内选股之前的工作都是以中证800或者沪深300成分股为样本股票池。但是在不同的样本股票池中,因子集的持续表现是否一致?最常见的样本子集就是行业了。因此我们觉得决定利用现有的因子贡献度体系,对行业进行一次梳理,初步筛选出适合用多因子方法选股的行业,以及相应有效的因子集。 2.2 行业内选股的常见挑战基本面因子包含行业属性行业内股票数目过少行业内公司同质性过强相对于全市场信息扩散速度更快朝阳行业难以用量化因子衡量 2.3 行业内量化选股的两个陷阱确实在特定的市场状态下,可以通过因子的力度和持续程度总结出超额收益股票的一些指标特征。但问题在于,这种市场状况的归类,本身就是不可测的。站在任何一个时点上,我们都可以知道过去是什么市场状况;有经验的投资者,也能大致判断出当前所处的市场阶段;但是谁能预知到未来几个月,或者说未来你的量化选股组合持有期,是在牛市、熊市还是震荡市?陷阱一市场状况的不可测 2.4 行业内量化选股的两个陷阱即使对市场状况的分类预测对,这种统计规律也只是必要非充分条件,不能确保在未来能发生相同的故事。其本质在于这些因子特征的来源,究竟是市场状况导致的,还是其他因素导致的,比如宏观政策、结构变化等等。有可能市场状况和统计规律都只是现象,两者在过去是由同一种内因驱动,但未来即使市场状况相同,因子的表现也未必相同。陷阱二伪统计规律 目录行业内区分度动量选股策略4基于因子贡献度的行业分析315行业内量化选股的挑战2背景回顾思考与后续研究 3.1 证监会行业在中证800中的分布统计代码ABDEFGHIJKLM对应行业农林牧渔采掘电力煤气及水建筑交通运输信息技术批发零售金融保险房地产社会服务传播文化综合类股票数目(最新)103738224834613259141012股票数目(平均)12 29 43 17 44 38 69 19 55 16 9 15 行业权重(最新,%)0.88.133.513.064.433.745.8622.346.181.230.730.99行业权重(平均,%)0.72 6.84 5.92 1.42 6.79 4.77 5.95 16.19 6.75 1.51 1.05 1.10 代码C0C1C2C3C4C5C6C7C8C99对应行业食品饮料纺织服装皮毛木材家具造纸印刷石油化学塑胶塑料电子金属非金属机械设备仪表医药生物制品其他制造业股票数目(最新)3218313753378117512股票数目(平均)32 20 3 11 85 32 82 112 45 1 行业权重(最新,%)4.531.110.150.684.542.128.2312.414.710.08行业权重(平均,%)4.54 1.42 0.16 0.77 5.76 2.06 11.23 10.18 3.45 0.04 3.2 行业内因子贡献度衡量体系回顾区分度动量选股策略的逻辑,是希望观察到因子区分度的动量,并利用半衰期跟踪动量的衰竭程度,因此选择的因子集应该具备以下两点:因子区分度应当显著区分度的动量效应有较好的持续性除了以上两点,还应该把因子贡献度的偏离状况也作为衡量体系中的一个指标•贡献度积分面积/样本区间长度显著性•样本区间长度/(穿越次数+1)持续性•贡献度求和/样本区间长度偏离性 3.3 基本面因子集因子名称说明因子意义流通市值最新季报日流通市值市值规模净资产最新季报股东权益合计资产规模净资产增长率过去两年净资产季报数据回归经营能力净资产收益率最新年报ROE盈利能力每元净资产经营现金流过去十二个月经营现金流/净资产现金流水平每元净资产营业收入过去十二个月营业收入/净资产收入水平净利润增长率过去两年净利润季报数据回归成长能力股息率最新年报股息率投资收益资产负债率最新年报资产负债率偿债能力 3.4 估值因子集与市场因子集因子名称说明因子意义市盈率市值/过去十二个月净利润估值水平市净率市值/最新季报股东权益合计估值水平市现率市值/过去十二个月经营现金流估值水平市销率市值/过去十二个月营业收入估值水平因子名称说明因子意义价格动量过去60个交易日累计收益率市值规模换手率过去60个交易日平均换手率资产规模波动率过去60个交易日收益率标准差经营能力总市值最新总市值市值规模股价最新股票价格单位价格机构持股机构持股/流通股本机构参与 3.5 适合量化选股的行业特征 3.6 基本面因子集半衰期选股策略季度收益代码ABDEFGHIJKLM对应行业农林牧渔采掘水电煤气建筑交运仓储信息技术批发零售金融、保险房地产业社会服务传播文化综合类因子持续性(平均)15.32 16.00 14.02 16.43 16.01 12.74 18.70 12.69 15.88 14.77 14.08 12.33 股票数目(平均)12 29 43 17 44 38 69 19 55 16 9 15 代码C0C1C3C4C5C6C7C8对应行业食品饮料纺织服装造纸印刷石化塑胶电子金属非金机械设备医药生物因子持续性(平均)14.64 13.75 13.56 16.01 13.73 17.53 18.17 17.15 股票数目(平均)32 20 11 85 32 82 112 45 综合上述5点的分析,可以得出结论,行业内股票数目多且因子集整体持续性好,上市公司兼具差异性和可比性的行业适合采用多因子量化策略选股。其中前两点可以量化,而差异性和可比性则依赖于主观判断。从上表可以看到,在不考虑差异性和对比性以及是否朝阳行业的前提下,交运仓储、批发零售、房地产、石化、金属非金属、机械设备和医药生物可能适用于区分度动量选股。 目录行业内区分度动量选股策略4基于因子贡献度的行业分析315行业内量化选股的挑战2背景回顾思考与后续研究 4.1 行业内因子集的选择STEP1•将因子集的三个衡量指标分别进行排名,对于每个因子来说,都得到一个三维数组。STEP2•将持续性、显著性和偏离性排名分别以3:2:1的权重进行加权,得到每个因子的加权排名STEP3•选取19个因子中加权排名考前的8个因子作为区分度动量策略的因子集。前面定义了因子贡献度的持续性、显著性和偏离性,但对于区分度动量策略而言,这三个方面的重要程度并不一致,持续性>显著性>偏离性。在选因此择因子时,按照以下步骤进行 4.2 行业内区分度动量选股实例根据上述三个步骤,最终选出适用石化行业的8个因子分别为股价、机构持股、净资产收益率、换手率、市盈率、总市值、净资产和净资产增长率。以这8个因子作为因子集,用区分度动量和半衰期在行业内选股,从2007年1月4日至2010年8月13日进行回溯,实证的结果如下:行业收益T=20T=30T=40T=50T=60多头组合106.26%168.73%118.47%144.77%81.35%98.48%空头组合106.26%19.32%59.27%70.27%131.95%115.47% 4.3 另一个例子-机械设备行业行业收益T=20T=30T=40T=50T=60多头组合133.91%161.17%178.77%176.88%154.36%150.86%空头组合133.91%91.80%83.87%106.11%159.12%157.18%在20-40的观察期多头占优,而长观察期出现了反转效应行业内信息传播速度将全市场更加迅速,反应周期更短下图机械设备行业的实证结果也发生了类似的情形 目录行业内区分度动量选股策略4基于因子贡献度的行业分析315行业内量化选股的挑战2背景回顾思考与后续研究 5.1 后续研究方向行业内选股的细化•不同行业的定量分析,因子集筛选观察期参数探讨•行业内信息传导速度差异性研究选股模型优化•向非线性模型探索 谢谢关注!联系人程景佳15810798760chengjjia@guosen.com.cn