凉秋九月菊花发(金工、宏观)20240927_导读 2024年09月28日20:52 关键词 股票关联性市场状态因子生成风险因子交易模式动态加权回测指增深度学习趋势指标波动性指标历史数据风格因子时间序列特征提取GSMGRU循环神经网络深度学习网络信息损失 全文摘要 研究人员开发了一种新模型,旨在捕捉股票之间的关联性,并根据市场状态进行个性化分析。该模型通过风险因子、趋势和波动性指标划分市场状态,并针对每种状态构建特定子模型,以优化交易模式识别。模型动态加权合成,优于传统模型,并通过量化股票相似度识别市场波动下的关联性。 凉秋九月菊花发(金工、宏观)20240927_导读 2024年09月28日20:52 关键词 股票关联性市场状态因子生成风险因子交易模式动态加权回测指增深度学习趋势指标波动性指标历史数据风格因子时间序列特征提取GSMGRU循环神经网络深度学习网络信息损失 全文摘要 研究人员开发了一种新模型,旨在捕捉股票之间的关联性,并根据市场状态进行个性化分析。该模型通过风险因子、趋势和波动性指标划分市场状态,并针对每种状态构建特定子模型,以优化交易模式识别。模型动态加权合成,优于传统模型,并通过量化股票相似度识别市场波动下的关联性。研究还讨论了美国经济放缓对中美贸易的影响,指出短期内中国出口可能阶段性回落,但长期仍有好转可能。同时分析了美国库存周期的结构性特点和制造业周期的修复情况,预计耐用品需求将得到提振,非耐用品市场呈趋势性回升,美国对中国进口依赖度高,进口需求反弹时,中国出口将显著增长。 章节速览 ●00:00创新模型提升股票关联性与市场状态分析 研究人员开发了一种新模型,旨在捕捉股票之间的关联性,并根据市场状态细分进行个性化分析。该模型通过风险因子、趋势和波动性指标划分市场状态,并针对每种状态构建特定子模型,以优化交易模式识别。模型动态加权合成交互效果显著,实现优于传统量价基础模型的回测表现。此外,研究还通过量化股票相似度,识别市场波动下的股票关联性,为投资者提供了更加精细的市场状态理解和股票选择依据。 ●08:00市场状态切分与风险因子表现分析 分析了市场指数在时间序列上的变化,通过选取万德和全A作为市场指数,使用趋势指标和波动性指标对市场状 态进行切分。趋势指标反映了市场中短期趋势,波动性指标衡量了市场的波动程度。根据两种指标将市场状态分为六种,以此分析不同市场状态下风险因子的表现。结果显示,市场状态对风险因子表现有显著影响,不同状态下的交易模式和风险偏好各异,为后续的子模型学习提供了依据。此外,介绍了一种基础模型及其六个子模型,这些模型都是在基础模型上进行微调的,旨在更好地理解和适应市场状态的变化。 ●15:54多频段数据融合的股票收益预测模型 该模型综合使用了股票的60天日线序列和20天分钟线序列,以及风格因素,共三部分数据。首先,通过GSM算法从两组时间序列中提取特征,得到1600个特征,再经过映射得到64维特征,表示与未来预期收益相关的80个因子。这些因子包括日线、分钟线和风险因子信息。接下来,通过注意力机制挖掘股票间的关联性,形成5000乘80的相似度矩阵,与因子集结合,以加强股票特征的解释力。最终,通过全连接层得到预测结果。整个模型设计旨在全面提取和融合不同频率数据信息,以提高股票收益预测的准确性。 ●23:20动态微调预训练模型优化股票市场状态预测 为提升股票市场状态预测的精准性与适应性,先构建一个基础模型,通过预训练在不同年份覆盖特定区间数据上训练,以确保模型具备一定普适性。随后,针对六种预设市场状态(如市场暴涨、平稳上涨等),基于基础模型进行微调,聚焦特定状态数据进行二次训练,特别锁定关键参数固定,以减少过拟合风险并优化后续学习。微调时采用较低学习率,确保模型在特定状态下的表现最优。最后,通过动态加权复合六个子模型的输出,结合市场状态的实时变化,以提升模型的稳定性和适应性,解决单一模型状态划分主观性及不确定性问题。 ●29:55标签中性化与市场状态识别对选股因子影响分析 研究了在股票市场预测中,对训练标签进行中性化处理以及引入市场状态识别对选股因子表现的影响。结果显示,中性化标签有助于减少行业和市值因素对收益的影响,特别是在市场极端波动时,能显著改善预测结果的稳定性。此外,通过市场状态识别构建的子模型,不仅提高了因子的稳定性,还增强了因子对不同市场状态下的适应能力,尤其在小盘股和沪深300指数上的表现更为突出。最终策略测试表明,结合市场状态的因子表现优于基础模型,为实际投资提供了有益的参考。 ●41:39海外库存周期与中国出口展望 讨论了美国经济放缓对中美贸易的影响,指出美国作为全球重要消费端,其需求变化直接影响中国出口。预计短期内中国出口将阶段性回落,但长期仍有好转可能。同时,分析了美国库存周期的结构性特点,指出非耐用品销售强劲但耐用品需求疲软,暗示随着利率下降,耐用品销售可能回升,库存周期将更有利于向上发展。 ●46:42美国制造业周期及库存情况分析 从时间线上分析,美国全球制造业周期的修复始于去年7月,反映在工业生产、产能利用率、进口、库存以及商品通胀等多个数据指标上。进入今年三季度,制造业增速开始放缓,PMI同比数据预示着制造业活动可能达到顶峰后回落。此外,回顾美国库存周期的三个阶段,从累库、去库到当前的相对均衡状态,可以看出制造业供需正 在逐步调整,未来需求的进一步增长将决定进口和生产的趋势。 ●52:10库存周期与美国经济的关联性分析 库存周期的核心引导变量是需求,而需求的增长依赖于美国消费者的消费能力和美国经济的个人收入水平。美国的高储蓄率和低消费倾向对经济的推动作用有限,但消费支出的持续性受劳动力市场影响显著。美联储的降息策略对于经济有重要影响,预防性降息有助于经济稳定。此外,高利率环境下,非耐用品的恢复优于耐用品,显示美国库存周期中的行业特征。 ●58:18美国耐用品市场与经济前景分析 在2022年初加息背景下,美国耐用品市场,尤其是机械设备,面临高库存与低销售的问题,处于历史高位的库销比说明市场状况不佳。随着降息周期开启,预期耐用品需求将得到提振。非耐用品市场在2023年下半呈现趋势性回升,成为推动美国制造业上升的核心力量。家具行业因美国移民潮和婴儿潮叠加,以及房地产上升,需求表现 突出。整体上,美国对中国进口依赖度高,进口需求反弹时,中国出口将显著增长。预计美国需求在短期内放缓,但降息将有助于耐用品市场修复,可能在明年年中迎来新的上行周期。 要点回顾 模型如何通过风险因子捕捉股票与股票之间的关联关系,并如何根据市场状态划分进行子模型构建?市场状态如何通过趋势指标和波动性指标进行切分? 模型通过使用风险因子来捕捉股票间的关联性,并结合市场的趋势指标和波动性指标对市场状态进行划分,共分为暴涨、持续上行、快幅震荡、窄幅震荡、暴跌以及持续下行六种状态。针对每种市场状态,分别建立了一个子模型以学习特定状态下的交易模式,确保每个子模型在对应状态下表现最优。市场状态通过趋势指标(反映过去60天内的价格上升或下降斜率)和波动性指标(60天窗口期的日收益率标准差)进行复合切分。根据趋势指标和波动性指标的不同阈值,将市场状态划分为6种类型,并且对划分规则与历史市场实际情况的一致性进行了验 证,结果显示划分规则与市场实际情况相符合,且切换频率适中。 模型生成的因子在实际回测中的表现如何? 在2018年到今年7月底的回测中,该模型的月度IC值约为14.5%,相较于基于纯量价因子的基础模型提升了约1%。此外,基于此因子构建的指数增强策略,在过去几年内实现了约15.6%的超额收益,总体而言,该因子模型的表现是相当不错的。 传统方法在建模股票预期收益时存在哪些局限性? 传统方法在建模股票预期收益时存在两个主要局限性:首先,它仅考虑股票自身的因子序列或特征序列,忽视了股票间的关联性和协同效应;其次,试图建立一种通用交易模式,但在市场状态频繁切换时可能难以适应极端行情,导致在某些时候出现回撤。 报告中提出的突破传统方法局限性的方法有哪些? 报告通过突破传统方法的局限性,从股票关联性和市场状态切分两方面入手。在股票关联性建模中,介绍了定性分类和定量计算相似度两种方法,并详细说明了使用16个因子作为相似度计算依据的过程及其评估结果,包括对因子解释力、相关性和时间序列稳定性等方面的考量。 不同市场状态下风险因子的表现有何差异? 不同市场状态下(如高波动、暴涨、快幅震荡、窄幅震荡、暴跌、持续下行),风险因子的表现存在显著差异。例如,在高波动状态下,因子偏好低流动性和低波动性;而在暴涨状态和宽幅震荡状态下,因子对杠杆的偏好相 对更明显;在暴跌状态下,所有因子的表现显著性普遍下降。通过分析六个不同市场状态下的风格因子表现,可以发现各个状态下风险偏好的变化规律。 在市场低波动状态下的风险因子表现是怎样的? 在市场低波动状态下的风险因子表现与历史统计数据一致,表现为偏好低波动、低贝塔、小市值、低估值等特征。例如,八月份市场持续下行时,低流动性面的均值可能达到0.1以上,且风险因子如低波动、低贝塔、小市值、低估值等更具优势,高成长类股票相对表现较差。 模型如何根据不同市场状态进行交易模式的识别? 模型旨在根据不同市场状态识别相应的交易模式,为此需要建立多个子模型来学习不同状态下的交易规律。首先,构建一个基础模型,该模型接收股票的相对长期低频序列(60天日线序列)和相对短期高频序列(20天分钟线序列)作为输入,并结合风格因素(如16个音符)进行分析。然后,通 过GSM和indicatemixing模块从时间序列中提取特征,生成80个因子,并与截面的16个因子拼接后输入至MLP模块 中进行转化,最终输出每个股票对应的阿尔法特征集。接着,在stopmission模块中,利 用16个风险因子挖掘股票间的关联性,通过注意力机制计算相似度矩阵,并重新加权以增强模型对未来收益的预测能力。 基础模型的训练过程及后续应用如何? 基础模型首先在特定年份(如2018年)使用过去五年的数据进行训练,以确保模型在多种市场状态下的普适性和相对较好的表现。训练好的基础模型作为一个预训练模型,在最终版本中,构建了六个针对不同市场状态(如暴涨、平稳上涨等)的子模型。每个子模型从基础模型出发,通过抽取符合对应状态的样本进行二次训练,将部分参数固定以提升子模型在特定市场状态下的表现。这样,在不同的市场条件下,子模型能够提供更精确的风险因子预测。 在模型训练过程中,子模型是如何进行微调的?为何采用多个子模型进行加权组合而非单一子模型?在模型训练时,首先将预训练阶段得到的参数固定,只对其他部分参数进行微调。在微调过程中,学习率缩小到了预训练时的十分之一,以更小的学习率进行调整。每年都会对六个子模型进行调整,并基于当前市场状态对子模型的权重进行动态加权复合,从而增加了模型使用的稳定性。采用多个子模型进行加权组合的主要原因是,市场状态的划分具有主观性,不同子模型对应不同市场状态,这样通过动态加权的方式可以提高模型的适应性和稳定性,相比仅使用一个子模型效果更好。 子模型权重计算的具体方法是什么? 子模型权重是根据当前市场状态与每个子模型对应平均状态的距离来计算的。如果当前市场状态更接近某个子模型的平均状态,则该子模型将获得更大的权重。这种权重调整方式使得最终模型能够根据当天市场状态的变化不断动态调整子模型权重,增强了模型对市场状态的适应性。 标签中性化处理对模型训练和结果有何影响? 标签中性化处理是指在训练时对原始未来收益率进行行业市值中性化处理,以去除行业和市值对收益的影响。结果显示,使用中性化标签后,模型在市场暴跌时的表现明显改善,这表明标签选择对模型最终结果有很大影响。 关联信息(如股票之间的关联性)对模型训练和预测能力有何影响? 去掉关联信息模块后,模型退化为一个基本模型,整体上五分组多头年化收益相比普通模型低约两个点,这表明关联信息对未来的收益有较大影响。