您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华创证券]:量化选股系列:机构情绪与个人情绪 - 发现报告
当前位置:首页/其他报告/报告详情/

量化选股系列:机构情绪与个人情绪

2023-09-05秦玄晋、王小川华创证券Z***
量化选股系列:机构情绪与个人情绪

金融工程 证券研究报告 专题报告2023年09月05日 【专题报告】 量化选股系列——机构情绪与个人情绪 华创证券研究所 证券分析师:秦玄晋 电话:021-20572522 邮箱:qinxuanjin@hcyjs.com执业编号:S0360522080005 证券分析师:�小川 电话:021-20572528 邮箱:wangxiaochuan@hcyjs.com执业编号:S0360517100001 相关研究报告 《ChatGLM助力量化选股》 2023-06-14 《人工智能助力量化投资——ChatGLM介绍》 2023-06-14 《基于canslim与FESC的沪深300指数增强策略》 2023-03-07 《行业轮动系列——FESC行业轮动投资框架 1.0》 2022-09-07 《CANSLIM3.0投资法——成长与价值轮动》 2022-06-17 《CANSLIM2.0投资法——华创金工大师系列成长型之一》 2021-10-16 在行为金融学的框架下,市场并非完全理性,每一个投资者都无法对全部新增信息进行及时准确的处理,因此信息可能需要花费比我们想象中更长的时间反应在股价中。我们从投资者对个股热度(注意力)的角度出发来看,当某些股票吸引了市场上更多投资者的注意力,可能会导致股价短期的快速反应与高估,降低股票未来的回报。相反,有着利好消息的股票可能因为投资者的忽视在短期内被低估,而在后续的缓慢曝光中获得回报。 原始热度单因子测试结果 总热度因子在2017年来该因子的IC稳定性非常高,超过80%的时间其IC小于0,2022年以来只有一期因子的IC大于0。IC平均值为-0.11,中位数为-0.13,年化IC_IR为-3.22,单因子检验结果非常显著。从分组测试的结果来看,该因子分组单调性较好,总热度因子Top组的负向收益显著,从年化收益、最大回撤等指标看,热度最高组的负向作用具有显著经济意义。 关注粘性因子与总热度相似,该因子的IC平均值为-0.039,中位数为-0.05,年化IC_IR为-1.66,虽然关注粘性因子相较总热度因子稳定性较差,但该因子检验结果同样较显著。从分组测试的结果来看,粘性和未来收益之间存在负向关系,关注粘性TOP组负向超额明显,低关注粘性组的组间区分度一般,BOTTOM组年化收益11%。 综合因子表现结果 将总热度与粘性因子进行等权合成构建Attn因子,Attn因子的IC平均值为 -0.09,中位数为-0.10,年化IC_IR为-3.26,单因子检验结果非常显著。相比两个原始因子,Attn因子分组单调性有显著的提升。Attn因子Top组的负向收益显著达-18%,BOTTOM组年化收益为15%同样非常显著。 为方便进一步分析,我们对Attn因子进行市值、过去1月收益、反转的中性化,中性化后因子的IC平均值为-0.08,中位数为-0.08,年化IC_IR为-2.96,因子检验结果相比中性化之前有影响的下降。另外,中性化之后因子的分组效果区分度同样较显著,Top组的负向收益为-13%,BOTTOM组与group_2、group_3的正收益均超10%。 Attn因子与分析师情感因子构建选股组合 我们引入之前报告《ChatGLM助力量化选股》中提到的分析师文本情感因子,使用其作为机构投资者情绪的代表,Attn因子作为个人投资者情绪代表,使用两个因子来构建选股组合进行测试。 2017年01月01日至今(8月31日)年化收益率24.6%,基准(中证1000)年化收益率-4.3%,阿尔法28.4%。策略最大回撤为33.1%,最大回撤发生在2021年11月26日至2022年4月26日。 从分年收益来看,2017年来策略的表现非常比较稳健,除2023年以外每年都有15个点以上的超额收益。 策略在22年整体回撤仅-1%,大幅小于主动型基金的收益中位数;组合2023 年至今(8月31日)绝对收益4%,相对基准超额收益9%,持续跑赢基准。 风险提示: 策略基于历史数据回测,不保证未来数据的有效性。 投资主题 报告亮点 近年A股市场的题材炒作活跃,风格轮动迅速,本报告从投资者行为角度出发,通过用户行为数据定量地构建了衡量投资者关注度的因子,从投资者行为导致的错误定价中挖掘投资机会。 投资逻辑 股价波动同时受到基本面以及投资者行为影响,在行为金融框架内,有限注意力会影响投资者的认知和行为,由于投资者在一定时期内只能处理有限数量的信息,因此投资者不太关注的一些公司,积极的基本面信息可能被忽略,反之,获得最高关注度的公司,可能更易出现股价过度反应的现象。本报告使用基于投资者行为数据构建的因子,通过测试符合上述猜想,行为因子对截面收益差异产生较稳定的解释,将投资者行为纳入考虑能有效改进基本面类因子。 目录 一、因子简介6 二、单因子测试7 (一)描述性统计7 (二)总热度因子测试9 (三)关注粘性11 三、综合热度因子测试14 1、热度合成因子测试15 2、热度因子条件双重排序检验18 3、组合因子中性化后检验19 4、在宽基表现上回测统计21 四、应用23 (一)Attn因子与分析师情感因子条件双重排序23 (二)Attn因子与分析师情感因子构建选股组合25 1、历史回溯25 2、最新TOP30个股名单27 �、总结28 六、风险提示28 七、参考文献29 图表目录 图表1主题行情与市场注意力6 图表2个股行情与个股注意力热度7 图表3关注度因子描述统计8 图表4因子覆盖度8 图表5宽基内因子覆盖度9 图表6总热度因子IC历史表现9 图表7总热度因子IC衰减9 图表8总热度因子IC统计结果10 图表9总热度因子分组月均收益10 图表10总热度因子分组超额收益曲线10 图表11总热度因子分组统计结果10 图表12总热度因子多空分组净值对比11 图表13总热度因子多空分组绩效对比11 图表14关注粘性因子IC历史表现12 图表15关注粘性因子IC衰减12 图表16关注粘性IC统计结果12 图表17关注粘性因子分组月均收益12 图表18关注粘性因子分组超额收益曲线12 图表19关注粘性因子分组统计结果13 图表20关注粘性因子多空分组净值对比13 图表21关注粘性因子多空分组绩效对比14 图表22总热度、关注粘性因子相关性15 图表23Attn因子IC历史表现16 图表24Attn因子IC衰减16 图表25Attn因子IC统计结果16 图表26Attn因子分组月均收益16 图表27Attn因子分组超额收益曲线16 图表28Attn因子分组统计结果17 图表29Attn因子多空分组净值对比17 图表30Attn因子多空分组绩效对比18 图表31市值、Attn条件双重排序18 图表32过去一月收益、Attn条件双重排序18 图表33换手率、Attn条件双重排序19 图表34中性化后Attn因子IC历史表现19 图表35中性化后Attn因子IC衰减19 图表36中性化后Attn因子IC统计结果20 图表37中性化后Attn因子分组月均收益20 图表38中性化后Attn因子分组超额收益曲线20 图表39中性化后Attn因子分组统计结果20 图表40中性化后Attn因子多空分组净值对比21 图表41中性化后Attn因子多空分组绩效对比21 图表42attn因子在不同基准池IC统计21 图表43中性化attn_沪深300IC时序图22 图表44中性化attn_沪深300多空分组对比22 图表45中性化attn_中证500IC时序图22 图表46中性化attn_中证500多空分组对比22 图表47中性化attn_中证1000IC时序图23 图表48中性化attn_中证1000多空分组对比23 图表49双重排序每组年化收益24 图表50低热度+高分析师情感组合股票样本数量24 图表51低热度+高分析师情感选股策略净值25 图表52行业分布26 图表53市值分布26 图表54策略风险收益27 图表55TOP30个股名单27 一、因子简介 行为金融理论经过数十年的发展,投资者有限理性逐渐得到了业界和学界的广泛接受,与传统理论的理性投资者与市场有效假说相比,行为金融框架中的投资者在决策时存在的心理偏见与情绪波动同样可以驱动股票估值的变化。这些非基本面的行为因素导致资产的价格偏离其内在价值,甚至产生资产泡沫,行为金融理论揭示了许多无法用风险补偿解释的市场异象来源。投资者有限注意力是行为金融研究中一个常见的概念,简而言之,注意力是一种稀缺资源,投资者面对大量信息时,往往只能关注其中的一部分,而忽略剩余的部分,从而导致了市场定价的失真,例如盈余公告漂移现象(Houetal,2009)。 今年爆火的ChatGPT于2022年11月推出,在起初两个月内国内外市场对此反应平平(图1,WindChatGPT指数),直到2023年1月底,随着ChatGPT活跃用户数量持续增长、相关媒体资讯集中式爆发(图1百度搜索指数),ChatGPT迅速走进我国投资者视野,取得了相当的关注度与讨论度,相关概念股受到投资者追捧,在两周内达到阶段高点。从ChatGPT推出到引爆市场的时间段中,ChatGPT模型自身能力并无显著变化,说明对市场而言,在注意有限力的背景下,对较为陌生的概念形成共识并非一蹴而就。 图表1主题行情与市场注意力 资料来源:wind,百度指数,华创证券 符合我们直觉的是,投资者很难每天追踪数千只股票,亮眼的财报可能会因为投资者的忽视而未被完全反映在股价中,另一方面,站在聚光灯下的股票在短期热炒后股价回报可能难以持续。投资者的有限注意力决定了有限的选择集,热门的股票在注意力的驱动下而获得大量资金流入。在有限注意力的研究中,一个需要首先解决的问题是:如何量化投资者的“注意力”?注意力是无形且不可观察的,在早期研究中,新闻头条、异常成交量与股价波动(Odean,2000)是常见的投资者注意力的代理变量,近年,更多样的数据来源在研究中被用作注意力的代理变量,如Wen(2019)使用了百度搜索指数衡量个人投资者注意力,相比传统数据更加及时与直接。 在本篇报告中,我们采用同花顺“总热度”、“关注粘性”因子来衡量投资者的注意力。 总热度表示过去一段时间,投资者对个股、行业指数、板块指数等的总搜索及关注次数。关注粘性表示指标当天相对过去一段时间前,用户再次关注个股、行业指数、板块指数的占比。 图表2个股行情与个股注意力热度 资料来源:同花顺,华创证券 上图展示了国网英大的股价走势与标准化的总热度指标(总热度滚动36个月分位数)对比图,股价的上涨与下跌趋势与热度存在同期的同步性,而当个股的热度位于历史极值区间时,股价往往也来到了阶段性的高点或低点。由此我们推测,在全市场范围内,具有更高热度的股票可能带来了更多注意力驱动的买入,导致股票短期内被过度定价,从而减少其未来股价上涨空间;相反,低热度股票中存在一些被严重低估的股票。 下面我们先对总热度与关注粘性因子进行单因子测试分析,再尝试将两个因子进行合成,构建一个综合热度因子,文章最后探讨热度因子的应用。 二、单因子测试 (一)描述性统计 在上文我们对两个因子的定义进行过简单的介绍,在此我们对两个因子进行描述统计,分析两个因子历史的分布特征: 图表3关注度因子描述统计 统计量 总热度 关注粘性 均值 2.53 23.15 标准差 4.41 9.77 最小值 0 0.00 25%分位 0.61 16.41 中位数 1.24 22.31 75%分位 2.66 28.76 最大值 198.62 87.00 资料来源:同花顺,华创证券 本文对两个因子的时间区间均为一个月,总热度指标取值区间为[0,10000],对每一只股票,总热度指标为股票的浏览、自选与点击次数之和,以同一日在全市场占比的方式进行归一化,将归一化后的数值乘以10000;关注粘性表示当前对比一个月前用户再次关注个股的占比,取值区间为[0,100]。 总热度因子的