量化专题报告 如何利用AI模型寻找日内最佳买卖点? 2024年10月25日 对于深度学习类的高换手组合,vwap成交要好于收盘价成交,选择准确 的交易时点可以带来组合收益增厚。以我们在之前的报告《深度学习模型如何控制策略风险?》中构建的元学习风控因子在中证800内的多头组合为例,组合换手率约为年化单边24倍左右。vwap成交下年化超额收益率为19.1%,收盘价成交下只有16.5%。我们统计今年以来所有股票的日内最低价到收盘价平均涨幅为1.86%,中位数为1.19%;从日内最高价到收盘价的跌幅平均为 分析师叶尔乐 1.96%,中位数为1.46%,在这之中,若能选择正确的交易时点,则可以为组 执业证书:S0100522110002 合提供显著的收益增厚。 传统线性因子及事件的交易时点选择效果不明显。我们取股票5分钟频数 邮箱:yeerle@mszq.com研究助理韵天雨执业证书:S0100122120002 据计算10个技术因子,计算因子的时序IC以及信号平均多空收益,并无显著 邮箱:yuntianyu@mszq.com 收益。线性指标触发的事件也无法获得显著受益。原因可能有传统线性指标较为拥挤,漏掉集合竞价信息可能对因子准确率产生影响,数据粒度不够细或交 相关研究 易信号滞后等导致价格趋势跟踪过于粗糙,等等。因实时level2数据较难获 1.量化专题报告:全球资产量化:沙特权益 取,本篇报告着重针对前两个原因进行改进。 驱动因素与配置逻辑-2024/10/24 利用深度学习对于每一个交易时点单独建模预测5分钟后至收盘收益,交易时点选择显著优于传统线性因子。我们应用ALSTM模型预测股票未来五分钟至当天收盘的收益率,用个股过去最多240个5分钟频的量价数据作为输入, 2.量化周报:景气度继续回升-2024/10/203.量化分析报告:牛市各阶段哪些因子表现最好?-2024/10/154.量化周报:市场或延续震荡-2024/10/13 高开低收成交量共6个指标,预测五分钟后的节点至收盘的收益,并在每个时 5.基本面选股组合月报:中证500增强组合 间截点单独建模,信号平均多空收益率0.23%,显著优于线性因子。随后在模 9月超额收益达1.18%-2024/10/08 型中加入当天集合竞价的level2因子以及部分弱有效技术因子作为嵌入输入,模型信号平均多空收益提升至0.26%。 利用SAC强化学习模型进行实时交易决策,可以进一步增厚组合收益。在 股票市场中,强化学习对于高频数据的输入更加敏感,适合制定高频交易决策,SAC强化学习因其优秀的避免过拟合机制而被广泛应用至交易决策中。我们根据当前时间,将预训练好的46个深度学习模型对应特定时点的预测状态以及截面因子输入强化学习,通过多头注意力网络将二者结合,输入强化学习中进行在线交易决策,最终,策略函数将输出每个时间点对于每只股票的交易信号。强化学习信号平均多空收益0.34%,14:00-15:00胜率最高,中午至14:00间收益最高。 将强化学习信号应用在投资组合与指数中效果显著。利用一定规则进行交 易回测,SAC强化学习因子多头组合的年化超额收益率提升至较收盘价提升7.6%,较vwap成交提升5%,提升显著。但相比理论提升较低,这可能是因为部分股票没有成交信号,且取第一个信号时有效性相对较弱等原因。将个股信号合成至股指中,在沪深300,中证500,中证1000平均收益分别为10.3,10.9,11.8bps,在午盘时段收益较高。根据午盘时段估值多空信号计算沪深300日内择时累计收益,年均累计收益14.3%,胜率53.8%,赔率尚可。 风险提示:量化模型基于历史数据,市场未来可能发生变化,策略模型有 失效可能。 目录 1分钟频因子的日内交易信号3 1.1日内交易时点选择的意义3 1.25分钟频简单量价因子的日内择时效果5 1.35分钟频简单K线事件的日内择时效果6 2深度学习日内交易时点寻优7 2.1深度学习模型选择7 2.2ALSTM模型预测交易时点8 2.3对于ALSTM模型的改进10 3SAC强化学习日内交易时点寻优12 3.1SAC强化学习12 3.2强化学习模型策略表现14 3.3宽基指数的交易时点预测16 4总结与思考19 5风险提示21 6附录22 参考文献22 插图目录23 表格目录23 1分钟频因子的日内交易信号 1.1日内交易时点选择的意义 在股票投资中,选择合适的交易时机和价格能够显著提升投资组合收益率。相对于每天的收盘价,在调仓时选择低于收盘价的时点买入或者高于收盘价的时点卖出可以帮助投资者获得投资组合的收益增厚。在一般的策略回测中,我们常用vwap(成交量加权均价)来模拟当天的成交价,vwap是衡量交易质量的一个重要基准,因为它反映了一天内交易价格的加权平均水平。2024年以来vwap与收盘价格相差6个基点,差异微乎其微,且分布基本服从正态分布。 图1:2024年以来vwap与收盘价的价差分布 资料来源:Wind,民生证券研究院绘制 用一个具体例子测试一个高换手投资组合下,不同价格的收益差距。以我们在之前的报告《深度学习模型如何控制策略风险?》中构建的元学习风控因子在中证800内的多头组合为例,组合换手率约为年化单边24倍左右。我们分别测算回测区间内,每周第一个交易日调仓,费用双边千分之三的设定下,vwap成交与收盘价成交的收益区别: 图2:vwap成交与收盘价成交的收益区别 资料来源:Wind,民生证券研究院绘制 vwap成交的年化超额收益率为19.1%,收盘价成交下则只有16.5%。结果表明,vwap成交要略好于收盘价成交。一般来说深度学习因子对于即时信息的预测能力更好,均价反映了股价一天的平均表现,而收盘价较均价反映更加靠后的信息,故收盘价成交表现不如均价。但在其他类组合如优秀基本面组合中,随着换手率降低,vwap成交与收盘价成交差距可能进一步缩小。 从最低价至收盘价或者从最高价到收盘价间都有充分的收益空间。我们统计近一年内所有股票的日内最低价到收盘价平均涨幅为1.86%,中位数为1.19%;从日内最高价到收盘价的跌幅平均为1.96%,中位数为1.46%。 图3:日内最低价至收盘价收益分布图4:日内最高价至收盘价收益分布 资料来源:wind,民生证券研究院资料来源:wind,民生证券研究院 故我们可以看出,若能选择日内正确的交易时点,可以在不改变投资组合本身持仓的情况下,通过更合理的成交价格以提升组合收益。 1.25分钟频简单量价因子的日内择时效果 我们从分钟频数据出发,试图找出对日内交易时点有预测作用的信号,以打败收盘价成交。一个自然的想法是用常见的日频技术指标算法在分钟频数据上进行应用。考虑到计算资源的稀缺性以及分钟频数据的庞大,我们取股票5分钟频 数据计算10个技术因子,考虑到股票开盘价格变动迅速,成交成功率相对较低,我们取9:35为每天首个信号计算截止点,作为5分钟后的交易决策参考。因子具体定义如下: 名称含义计算方式方向 MA_24 移动平均线 过去24期收益移动平均 -1 EMA_24 指数移动平均线 过去24期收益指数移动平均 -1 MA_5_48 收益动量放大 过去5期均价/过去48期均价 -1 VR 成交量比率 在过去24期中,价格上升时的成交量总和/价格下降时的成交量总和 -1 RSI 相对强弱指数 过去24期价格平均上升幅度/平均下降幅度 1 Vol_5_48 成交量放大 过去5期平均成交量/过去48期平均成交量 -1 ADL 能量潮 价格变动比例乘以成交量的累计求和 -1 MACD MACD 过去12期EMA-过去24期EMA的9期EMA -1 Vol_std_12 成交量波动率 过去12期对数成交量波动率 -1 ncskew 负偏度系数 负偏度系数 1 表1:线性技术指标构建方式 资料来源:wind,民生证券研究院 我们计算因子的时序IC与到收盘价的预期多空收益来评估因子的日内择时效果。因子的时序IC定义为每只股票在当天每个时刻因子值与五分钟后至收盘收益的相关性,即每只股票每天都有一个IC。对于多空收益,我们首先需要一个规则将因子值转化为多空信号,一个自然的想法是计算因子在最近一段时间的分位数以判断其股价是否在高位或者低位。我们计算当前因子值在过去960期(即20个交易日)的40%及60%分位数,若指标为正向,小于40%分位数则发出买多信号,大于60%即发出卖空信号;若指标为反向则相反。回测从2019年开始,剔除新股,ST股与每日的涨跌停股票。10个技术指标的回测结果如下: 表2:高频线性技术指标表现 名称 含义 IC均值 平均多空收益 MA_24 移动平均线 -0.013 0.02% EMA_24 指数移动平均线 -0.011 0.02% MA_5_48 收益动量放大 -0.021 0.05% VR 成交量比率 -0.098 0.06% RSI 相对强弱指数 0.109 0.09% Vol_5_48 成交量放大 -0.073 0.05% ADL 能量潮 -0.008 -0.01% MACD MACD -0.055 0.03% Vol_std_12 成交量波动率 -0.084 0.04% ncskew 负偏度系数 0.134 0.05% 资料来源:Wind,民生证券研究院绘制 从结果来看,10个因子的平均IC都较为显著,但平均多空收益较低,无法显著跑赢收盘价。 1.35分钟频简单K线事件的日内择时效果 除根据因子信号的时序阈值进行日内买卖时点选择外,事件型策略也可以产生多空信号。我们在前文提到的因子基础上建立了4个事件型策略,事件多空信号定义与每次事件的平均多空收益如下: 多头事件信号 空头事件信号 平均多 表3:高频k线事件的日内择时效果 中轨且R 价格高于布林带中轨且RSI超卖 价格低于布林带 MACD金叉 反向MA 价格接近布林带下轨且J小 价格大于 资料来源:Wind,民生证券研究院绘制 综上我们发现,简单线性的因子型策略与事件型策略都很难相对收盘价有明显超额收益,尤其在考虑到交易滑点与大体量投资组合的冲击成本后。原因可能有以下几点: 1.信号拥挤从而导致传统线性指标失效:许多投资者利用类似信号盯盘进而做出交易决策,导致市场对价格反应迅速,传统线性指标失效。 2.漏掉集合竞价信息无法考虑股价跳开:线性因子最多考虑过去48期的5分钟k线,但这其中并不包含集合竞价的信息。每日集合竞价决定了当天的开盘价,而集合竞价中价格的波动率与成交量相关性等因素都可能对当天的筹码分布起到影响,漏掉这部分信息可能对因子准确率产生影响。 3.数据粒度不够细,交易信号滞后等导致价格趋势跟踪过于粗糙:在信号的构建中,我们只用到5分钟频的实时数据,预测五分钟后的交易信号,在这5分钟内,个股的筹码分布可能发生变化。如果基于实时逐笔委托构造信号并减少信号滞后时间,信号很可能更有效。然而,考虑到实时level2数据成本过高以及计算资源的稀缺性,本篇报告中不做这部分的相关讨论。 2深度学习日内交易时点寻优 针对1.3中提出的问题,我们尝试探索一些新的方法对日内交易时点进行预测。在过往的报告中,我们在机器学习预测股票收益的方向做出了一些探索与创新,包括深度学习与强化学习等。在下文中,我们将尝试采用此类非线性的方法对交易时点进行预测。 2.1深度学习模型选择 深度神经网络是一种基于多层神经元的无监督算法,它被广泛应用于计算机视觉、自然语言处理等领域。深度学习的主要神经网络模型包括:卷积神经网络 (CNN)、递归神经网络(RNN)、长短时记忆网络(LSTM)、门循环单元网络 (GRU)等等。其中LSTM是一种用于处理和预测基于时间的序列数据的递归神经网络(RNN)。相比传统RNN,LSTM可以克服长期依赖问题,能够有效记住长时间跨度的序列信息。LSTM通过其内部结构(输入门、遗忘门和输出门)来控制信息的传递,从而记住或丢弃与预测任务相关或无关的信息。 图5