您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:A股市场行业基本面先行因子及其对行业收益的预测作用 - 发现报告
当前位置:首页/其他报告/报告详情/

A股市场行业基本面先行因子及其对行业收益的预测作用

2011-02-25董艺婷国信证券劫***
A股市场行业基本面先行因子及其对行业收益的预测作用

A股市场行业基本面先行因子及其对行业收益的预测作用证券分析师:董艺婷电话:021-60933155E-mail:dongyt@guosen.com.cn证券投资咨询执业证书编号:S09802100030026联系人:郑云电话:021-60875163E-mail:zhengyun@guosen.com.cn联系人:毛甜电话:021-60933154Email:maotian@guosen.com.cn 整体思路及新行业分类未来应用及优化单行业预期收益模型预期收益在行业配置上的应用行业先行因子筛选 新行业分类基本面先行因子筛选单行业预期收益率模型行业配置模型模型优化及未来应用展望整体思路 一级行业一级行业二级行业为什么要进行新的行业分类?•新分类兼顾行业的差异性和相关性•为研究做支持81个二级行业缩小为43个新行业,一级行业中,一些相关性较高的二级行业得以合并,而相关性较低的二级行业也能够独立出来,单独进行分析 新行业分类部分情况新分类更符合现实情况 整体思路及新行业分类未来应用及优化单行业预期收益模型预期收益在行业配置上的应用行业先行因子筛选 基本面先行因子筛选流程原始数据搜集数据预处理因子筛选 •CPI同比、RPI同比、PPI同比•工业增加值、进出口额等宏观因子•准备金率、M1、M2、存贷余额•国债收益率、汇率、利率等货币因子•行业的产量、销量、市场状况•行业相关的其他特有数据等行业因子•为了寻找到行业运行的基本面先行因子,我们从未知的因子世界里搜罗了一系列备选因子以供分析。•因子数量虽然繁多,但归结起来,大致可以分为以下三类:宏观因子、货币因子、行业因子。•其中宏观因子与货币因子为共有因子,行业因子为特有因子。原始数据搜集 连续时间段数据缺失样本期内数据长度不足缺失数据过多样本期内少量数据缺失变量剔除变量插补个案剔除热卡填充回归填充多重替代均值替换•出于各种原因,如数据源出错、数据发布存在一定的缺失规律、人为录入出现纰漏等,数据的不同程度缺失总是不可避免。•缺失的数据会对进一步分析造成相当大的障碍,如进行多元回归时,数据中如果存在缺失项,而不加任何处理就直接进入回归,那么其可信度势必令人怀疑。怎么办?数据预处理 •筛选方法:Granger因果检验•筛选目的:剔除掉那些一方面与行业收益率没有因果关系,另一方面即使有因果关系,但属于滞后变量,无法在实际中应用到行业收益率的预测中的因子•筛选步骤见右图预处理后的因子序列X 行业指数收益率序列Y 若X为Y的Granger原因,则X为先行因子Granger因果检验输入行业预期收益模型对应AIC值最小的滞后阶数,为因子先行阶数先行因子筛选 经过细致地筛选,各行业的先行因子得以面世。以商业零售行业为例:先行因子结果表7:零售行业先行因子筛选结果及先行阶数 宏观指标 货币指标 行业指标 先行指标 阶数 先行指标 阶数 先行指标 阶数 CPI:累计同比 1 CHIBOR加权平均 6 家具类零售总额增速 1 PPI:全部工业品:当月同比 2 CHIBOR隔夜 6 建筑及装潢材料类零售总额增速 1 PPI:全部工业品:环比 1 CHIBOR7天 6 名义消费品零售总额增速 1 PPI:全部工业品:累计同比 1 银行间回购利率加权平均 6 CPI 食品同比 1 进出口金额:当月同比 1 银行间回购利率隔夜 6 RPI 食品同比 1 进口金额:当月同比 1 银行间回购利率7天 6 日用品类零售总额增速 1 产销率:累计值 1 准货币-储蓄存款 3 粮油类零售总额增速 2 CPI:当月同比 1 肉禽蛋类零售总额增速 4 RPI环比 1 RPI同比 2 资料来源:国信证券经济研究所 有关先行因子的讨论先行因子能否固定不可固定测试变化程度决定调整频度允许固定因子先行特征稳定亦或者有可能有的行业先行因子稳定,有的行业先行因子易变 先行因子调整的成本取舍样本截止先行阶数先行指标样本截止先行阶数先行指标2010/10/311CPI:累计同比2009/12/311CPI:累计同比2PPI:全部工业品:当月同比2PPI:全部工业品:当月同比1PPI:全部工业品:环比3PPI:全部工业品:环比宏观因子1PPI:全部工业品:累计同比1PPI:全部工业品:累计同比1进出口金额:当月同比1进口金额:当月同比1进口金额:当月同比1产销率:累计值1产销率:累计值1CPI:当月同比1CPI:当月同比先行阶数先行指标先行阶数先行指标6CHIBOR加权平均5CHIBOR加权平均6CHIBOR隔夜6CHIBOR隔夜货币因子6CHIBOR7天6CHIBOR7天6银行间回购利率加权平均6银行间回购利率加权平均6银行间回购利率隔夜6银行间回购利率隔夜6银行间回购利率7天6银行间回购利率7天3准货币-储蓄存款5人民币存款基准利率3个月2M03准货币-储蓄存款先行阶数先行指标先行阶数先行指标1名义消费品零售总额增速3金银珠宝类4鞋类增速1名义消费品零售总额增速行业因子2CPI同比4鞋类增速2CPI 食品同比2CPI同比1RPI同比6CPI 食品同比2RPI 食品同比1RPI同比1RPI 服装、鞋帽同比6RPI 食品同比6粮油类1RPI 服装、鞋帽同比4肉禽蛋类样本数据有限,频繁调整因子是否划算? 整体思路及新行业分类未来应用及优化单行业预期收益模型预期收益在行业配置上的应用行业先行因子筛选 •在行业预期收益模型的建立方法上,我们采用多元线性回归的方法•这里,我们遇到了需要解决的第二个问题——多重共线性。多重共线性的概念•线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性多重共线性的后果•增大最小二乘估计量的方差;•参数估计值不稳定,对样本变化敏感•检验可靠性降低,产生弃真错误。多重共线性的判断方法•直观判断方法•方差扩大因子法(VIF)。VIF超过10,常常表示存在多重共线性多重共线性的主要处理方法•逐步回归法•岭回归法•主成分分析法模型的多重共线性问题 源数据:新分类下的行业指数收益率序列,行业先行基本面因子数据频度:月样本区间:2005年1月至2010年10月,起始观察点为2005年1月,最短观察期长度为36个月,递月增加观察期长度,预测区间为一个月回归方法:岭回归K值选择:为了既满足方差膨胀因子(VIF)小于10,又符合k值越小越好的原则,我们将对比各k值下的的各变量VIF值,选取满足所有变量VIF值均小于10的最小的k值。模型数据及回归方法说明 •岭回归预测模型•其中,ppmt均为已进行过滞后处理的先行因子。•先行因子数据的提前可获得性,使得每个月得到的各变量参数估计值,可用于下月的收益预测。•如2008年10月初,所需要的先行因子的数据只需是滞后了一阶的数据(最晚是2008年9月的数据)便足以。 1122**...*tttmmttyintercept b ppb ppbpp 单行业预期收益模型 单行业预期收益模型流程T月•观察期起点:2005.1•观察期终点:T-1月•回归得到参数估计值集BT-1•利用可得的先行因子集PT和BT-1得到T月预期收益T+1月•观察期起点:2005.1•观察期终点:T月•回归得到参数估计值集BT•利用可得的先行因子集PT+1和BT得到T+1月预期收益T+N月•观察期起点:2005.1•观察期终点:T+N-1月•回归得到参数估计值集BT+N-1•利用可得的先行因子集PT+N和BT+N-1得到T+N月预期收益 单行业预测效果实例-40-30-20-100102030402008-012008-032008-052008-072008-092008-112009-012009-032009-052009-072009-092009-112010-012010-032010-052010-072010-092010-112011-01零售_真实零售_预测-80-60-40-2002040602008-012008-032008-052008-072008-092008-112009-012009-032009-052009-072009-092009-112010-012010-032010-052010-072010-092010-112011-01电子_真实电子_预测无法确定预测准确的归因样本外区间真实-预测相关性滞后一期真实-预测相关性2010.01-2010.100.54700.59432010.01-2011.010.48920.5724样本外区间真实-预测相关性滞后一期真实-预测相关性2010.01-2010.100.69380.00812010.01-2011.010.65430.1242预测准确并非来自动量 整体思路及新行业分类未来应用及优化单行业预期收益模型预期收益在行业配置上的应用行业先行因子筛选 行业配置多空实际排名0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 多头实际平均排名空头实际平均排名预期收益能够实现行业间横截面的对比!样本外多空排名分明 预期收益情况对比-15.00 -10.00 -5.00 0.00 5.00 10.00 15.00 20.00 预测平均收益真实平均收益各个行业预期收益的残差如果接近正态分布,取平均数后,结果应该非常接近对市场整体收益率的预期 行业配置收益情况-40.0000 -30.0000 -20.0000 -10.0000 0.0000 10.0000 20.0000 多头累计收益空头累计收益中证800累计收益利用预测收益的排序筛选多头两端后,其真实累计收益效果显著! 行业配置分段收益情况模型外和样本外都显著优于空头表现和基准-40.0000 -30.0000 -20.0000 -10.0000 0.0000 10.0000 20.0000 多头分段累计收益空头分段累计收益中证800分段累计收益样本外效果模型外效果 整体思路及新行业分类未来应用及优化单行业预期收益模型预期收益在行业配置上的应用行业先行因子筛选 预期应用方向•行业整体推导市场•加入行业情景分析•回归参数变动分析•行业间横截面分析行业强弱判断行业政策敏感性分析市场整体状况分析师预测 后期优化准备行业预测失效分析先行因子分行业稳定性测试基本面因子库的系统化搭构系统风险因子变异不同样本期测试海量因子,更新及时,数据质量保证收益模型残差解析 分析师:董艺婷电话:021-60933155E-mail:dongyt@guosen.com.cn证券投资咨询执业资格证书编码:S0980510120055联系人:郑云电话:021-60875163E-mail:zhengyun@guosen.com.cn联系人:毛甜电话:021-60933154E-mail:maotian@guosen.com.cn谢谢关注!