金工专题报告20240305 证券研究报告金融工程金工专题报告 重拾自信选股因子更新从过度自信到重拾自信 研究结论 前言:《重拾自信选股因子从过度自信到重拾自信》作为东吴金工“行为金融拥抱选股因子”系列研究的第一篇,选取了行为金融学中一种非常常见的预期偏差过度自信,来展开讨论。重拾自信选股因子 20在该报告的基础上,对因子合成的方式进行了改进。本文在前文的基础上对数据进行了更新,回测时间推进至20231231。 过度自信因子:我们根据经典的DHS模型,创新性地运用高频分钟序列号数据,通过计算利好超涨和股价回调的时间点差距构造了过度自信因子CP。在回测期2014010120231231内,过度自信因子CP在全体A股中的月度IC均值为0028,年化ICIR为186;10分组多空对冲的 年化收益为1407,年化波动率为750,信息比率为188,月度胜率为7059,最大回撤率为714,整体表现较为稳健。 重拾自信因子:我们做了进一步思考,过度自信之后会不会有过度修正?所以我们将第一代过度自信CP因子和日内收益正交,将残差项作为第二代重拾自信RCP因子。在回测期2014010120231231内,重拾自信因子RCP在全体A股中的月度IC均值为0038,年化ICIR为 256;10分组多空对冲的年化收益为2049,年化波动率为689,信息比率为297,月度胜率为8487,最大回撤率为403,表现非常优异。在剔除了市场常用风格和行业的影响后,纯净RCP因子仍然具有不错的选股效果,年化收益为912,年化波动为502,信息比率为182,月度胜率为6975,最大回撤为718。 重拾自信因子的改进:在发布专题报告《重拾自信选股因子从过度自信到重拾自信》后,东吴金工认为在RCP因子的结合过程中丢失了过多选股信息,在回测期2014010120231231内,经过改进的新因子RCPnew在全体A股中的月度IC均值为004,年化ICIR为264,信 息比率为266,与老因子较为接近;不过剔除了市场常用风格和行业的影响后,纯净RCPnew因子年化收益为1168,年化波动为464,信息比率达到252,远超老因子。 风险提示:1未来市场变化风险;2单因子模型风险;3数据测算误差风险。 2024年03月05日 证券分析师高子剑 执业证书:S0600518010001 02160199793 gaozjdwzqcomcn 研究助理庞格致 执业证书:S0600122090090 panggzdwzqcomcn 相关研究 《重拾自信选股因子从过度自信到重拾自信》 20220602 《重拾自信选股因子20从过度自信到重拾自信》 20220915 122 东吴证券研究所 内容目录 1引言4 2过度自信因子的构建4 21DHS模型简介4 22CP因子的构造方法6 3重拾自信因子的构建9 31过度反应的后续过度修正9 32RCP因子的构造方法9 33RCP因子的改进11 34纯净重拾自信因子的表现12 4其他重要讨论14 41关于剔除收益率的讨论14 42新重拾自信因子的分年度表现16 43重拾自信因子的参数敏感性16 44重拾自信因子的多空收益分解17 45其他样本空间的情况17 46沪深300、中证500、中证1000、国证2000投资组合的构建18 5总结20 6风险提示21 222 东吴证券研究所 图表目录 图1:DHS模型简介6 图2:日频因子CPIntraday构造示例7 图3:CPMean因子10分组及多空对冲净值走势8 图4:CPStd因子10分组及多空对冲净值走势8 图5:CP因子10分组及多空对冲净值走势8 图6:股票在收到利好消息当天的价格走势9 图7:RCPMean因子10分组及多空对冲净值走势10 图8:RCPStd因子10分组及多空对冲净值走势10 图9:RCP因子10分组及多空对冲净值走势11 图10:CPNew因子10分组及多空对冲净值走势12 图11:RCPnew因子10分组及多空对冲净值走势12 图12:纯净RCP因子10分组及多空对冲净值走势13 图13:纯净新RCP因子10分组及多空对冲净值走势13 图14:新旧纯净RCP因子10分组多空对冲净值走势14 图15:RCPdeRet20因子10分组多空对冲净值走势15 图16:基于沪深300成份股,不同投资组合的净值走势19 图17:基于中证500成份股,不同投资组合的净值走势19 图18:基于中证1000成份股,不同投资组合的净值走势19 图19:基于国证2000成份股,不同投资组合的净值走势19 表1:过度自信因子CP的10分组多空对冲绩效指标8 表2:重拾自信因子RCP的10分组多空对冲绩效指标11 表3:新旧CP、RCP因子的10分组多空对冲绩效指标12 表4:新旧重拾自信因子与常用Barra风格因子的相关系数13 表5:新旧纯净RCP因子的10分组多空对冲绩效指标14 表6:新重拾自信因子RCP分年度表现16 表7:纯净RCP因子分年度表现16 表8:过度自信因子、重拾自信因子的10分组多空对冲绩效指标(回看40、60日)17 表9:重拾自信因子RCP的多空收益分解17 表10:Vol20、Ret20、CP、RCP因子在沪深300、中证500、中证1000、国证2000成份股中的多空对冲绩效指标18 表11:基于沪深300成份股,不同投资组合的绩效指标20 表12:基于中证500成份股,不同投资组合的绩效指标20 表13:基于中证1000成份股,不同投资组合的绩效指标20 表14:基于国证2000成份股,不同投资组合的绩效指标20 322 东吴证券研究所 1引言 本篇报告为东吴金工“行为金融拥抱选股因子”系列研究的第一篇,于20220602进行发表。我们开创这个新系列的初衷在于,数据通常是客观理性的,但是人性并非是绝对理性的,所以仅依据往期数据而建立的传统量化模型屡屡被“打脸”,预测效果不够稳定,然而行为金融学却给我们提供了一种别样的思路“以人为本”,尽管外部环境变幻莫测,投资者的行为特征却是很难改变的,基于此构造的模型可能会让我们获得更加稳定且丰厚的回报。 作为系列研究的第一篇,本文选取了行为金融学中一种非常常见的预期偏差过度自信,来展开讨论。不同于用换手率来衡量过度自信的传统方法,我们基于DHS模型提出了CP(ConfidencePersistence,信心持久度因子)作为过度自信的新代理变量,在此基础上又通过剔除日内收益的影响构造了RCP(RegainedConfidencePersistence,重拾自信因子)。 重拾自信选股因子20在因子结合的方式上对因子进行了改进,并于20220915发布,本次更新将回测时间推进至20231231。改进后的重拾自信RCP因子在全市场10分组多空对冲的年化收益率为2126,年化波动率为798,信息比率为266,月度胜率为8067,最大回撤率为503,表现非常优异。 2过度自信因子的构建 21DHS模型简介 DHS模型是学术界非常经典的一个行为金融学模型,对短期动量和长期反转问题提出了一种基于投资者行为偏差的解释,由Daniel;Hirshleifer和Subrahmanyam等人在1998年提出。具体假设如下: 在时期0,投资者持有1单位的禀赋。 在时期1,知情交易者收到有关资产价值的信号s1,同时在时期2接收到关于真实资产价值的类似信号s2,形式如下: 1 2 式中,表示资产的真实价值信息;表示在时期1仅被知情交易者接收到的一些 私人信息;表示在时期2被所有投资者接收到的公共信息。进一步地,DHS模型保证: 2 422 02 同时,知情交易者是过度自信的,从而我们可以知道的精度要超出其真实水平,即 22。市场中资产的定价反映了个体关于资产真实价值的预期,所以在每个时间点 上: 1 2 3 由正态分布变量的性质,可得: 1 2 22 2222222 2 22222 我们暂时假设如果知情交易者变得如此自信以至于价值的2趋向于0,那么修正后 的定价公式为: 1 2 2 2222 2 注意在知情交易者的私人信息完全确定的情况下,第二个时期定价表达式的分母 D也将改变并服从于: 2222 22 22222 东吴证券研究所 简单来说,以收到利好消息为例(下文均以利好消息为例,利空消息逻辑相同,方向相反),时期0,所有交易者收到相同初始财富和信息。时期1,知情交易者收到关于股票价值的内幕噪声消息。产生过度自信,股价大幅上涨,远超股票的真实价值。时期2,所有交易者收到关于股票价值的公开噪声消息。过度自信有所减弱,但仍然存在,股价适当回落,仍超出股票的真实价值。时期3,股票真实价值被揭示出来。过度自信结束,股价继续回落到真实价值。 522 东吴证券研究所 图1:DHS模型简介 数据来源:Danieletal东吴证券研究所 22CP因子的构造方法 基于上述DHS模型的分析,我们就想,有没有什么办法可以刻画知情交易者的过度自信程度?区别于看涨幅、换手率等直观指标的思路,我们提出了一种新的方法:我们可以看时期1发生利好超涨和时期2股价回调,这两个时间点的差距。如果这两个时间点差距很大,那就说明知情交易者信心满满,他们敢于把股价维持在高位很长时间;如果这两个时间点差距较小,那就说明知情交易者信心不足,他们本身对利好消息也存有疑问。 我们将这种时间差距定义为CP(ConfidencePersistence,信心持久度)。我们认为CP的长短与内幕噪声消息的真实程度有关,如果内幕噪声消息的真实程度很低,即更像谣言,那么该消息将很快被辟谣,因此股价在高位持续的时间会很短,即CP很短;反之,如果内幕噪声消息的真实程度很高,股价将维持较长时间的高位,即CP很长。因此,我们以CP值的大小来构造因子,我们称它为“过度自信因子”,CP(高股价持续时间)越长,公司越利好,未来收益就会越高。 基于以上思考,我们定义CP的构造方式: 日频因子: (1)将每天9301130以及13001500之间的242分钟,标记为第1,2,3 242分钟,称其为分钟序号。 (2)使用每只股票每天242个的分钟收盘价,计算出240个分钟收益率。 (3)计算每天240个分钟收益率的均值mean和标准差std。 (4)逐一检视当天240个分钟收益率,大于meanstd的部分为快速上涨区间,小于meanstd的部分为快速下跌区间。 (5)分别计算快速上涨区间和快速下跌区间的分钟序号的中位数,用下跌中位数 622 东吴证券研究所 加上上涨中位数,得到日频因子CPIntraday。 以某股票某一天的分钟收益率为例(见下图2),图中标红的即为快速上涨区间,标绿的即为快速下跌区间。标红的快速上涨区间的分钟序号是1315162021333844 454754616264120126130139152156161165166181193217220225 234,那么中位数就是120;标绿的快速下跌区间的分钟序号是235812141819 232627314256658081121127159168198224230231,那么中位数就是 42,此时两个中位数的差CPIntraday就是4212078。 图2:日频因子CPIntraday构造示例 数据来源:Wind,东吴证券研究所 月频因子: (1)每月月底回看过去20个交易日,计算这20个交易日的日频因子CPIntraday的均值和标准差,分别对均值和标准差做横截面市值中性化处理,得到两个月度因子CPMean和CPStd。 (2)将CPMean改为从小到大的排序值1,2,3N,N为当期样本数;将CPStd改为从大到小的排序值1,2,3N,N为当期样本数。将两个排序值相加,得到最终的因子CP。 我们以2014010120231231为回测区间,CP因子的月度IC均值为0028,RankIC均值为0039,