关键数据及发现 -1- -2- -3- -4- 关键数据及发现 KEYFINDINGS 1.2023年,A股“冲高回落、震荡下跌”,量化进入存量博弈。私募规模扩张趋势放缓,新备案私募门槛增高,行业格局稳定性增强,已经形成了越来越快的“飞轮效应”:业绩好的机构形成口碑和规模,吸引了人才、资金、资源的大幅进入,同时算力、数据、投研等方面不断积累,资管规模不断扩大,而资源的增加又促成了良好业绩的产生。2023年,规模50亿以上机构从41家增加至50家,占整个量化私募5%。 2.量化机构的投研趋势之一体现在多资产、多信号、多频段融合。机构横跨多个资产类别,高中低频多个信号频段。 3.TB级别(41.07%)和PB级别(27.38%)是当前主流存储规模,PB级别(27.38%)则使得量化开始进入真正的“大数据”机构。低频量价数据的使用覆盖度最高(72.62%),其次是基本面财务数据(66.67%)和高频量价数据(58.33%)。高频量价数据维度大、噪声高,数据及因子一般不直接使用,需要进行大量数据清洗和加工,包括利用增量行情自动拼接全量行情,用快照数据重构订单簿,高频因子平滑处理等。 4.另类数据目前使用面最广的为分析师一致性预期数据及舆情数据,分析师一致性预期数据的分析主要有Alpha-Capture卖方预期评价、情绪打分、知识图谱构建等使用方式。事件、情绪维度的数据由于信息的滞后性则需要关注市场反身性避免形成反指。 5.量化机构通过研究经验、买方灵感、卖方研报、前沿信息获取研究灵感生成因子,按照因子种类、预测周期、产生背景,当前多因子已经形成非常庞杂的体系,量化机构一般会根据300、500、1000指增、中性等各类产品分配不同的因子比重,最常见的为70-80%量价类因子+20-30%(基本面因子+舆情和另类因子),以追求因子之间的低相关性。人工挖掘(覆盖度77.38%)以逻辑性因子为主,依赖于研究人员的专业知识和直觉,机器挖掘(覆盖度59.52%)以统计性因子为主,利用机器学习算法自动识别有预测能力的因子,发现人工方法难以识别的复杂模式和关系。 6.过往三年问卷调研数据显示,当前量化模型技术呈现多样性、复杂性,没有任何一种技术在所有环节中都占据绝对的优势,一个量化策略需要结合多种技术来处理不同问题。数据处理相关的环节模型应用较为集中(如数据清洗、特征提取、模型构建),而在直接的决策制定环节(如策略优化、高频交易)则较为分散。 7.组合优化环节,目前量化机构的优化器呈现更快、更复杂的趋势。更复杂表现在:除了回报(79.17%)和风险预测(76.79%)是优化的核心常见功能,交易成本(60.12%)、组合限制(48.21%)、业绩基准(42.86%)等、融券利率(19.64%)及基差成本(29.17%)等也有机构纳入了优化器功能之中。随着账户数量、投资标的和投资逻辑的不断增加,计算量更大,部分机构实现盘中分钟级别出交易清单。机构对市值、流动性、分散度、成分股等进行了风控,Barra模型是目前国内的主流风险控制模型,但在实际使用中有许多局限性,例如预测周期偏长、没有考虑特异性股池,A股的特点结合性有待提升等。所以很多机构除了根据其控制因子敞口,对标基准进行行业和风格约束之外,还会进行周期改动等优化调整。 8.量化机构会采用股指期货、融券、期权等多种方式或结合的方式进行对冲,持续跟踪成本差异,以求得对冲成本、对冲精度的最优解。寻常认知中,公众对高频与做空最容易产生误解,但样本池内数据显示,当前公众对做空策略有相对较为成熟和均衡的看法,能够认识到做空(占比83.84%)是市场正常机制的一部分,有助于发现价格泡沫和过高估值。只要不是恶意操纵市场,做空策略应该被允许(占比65.5%)。 9.不同的交易频率有其适应的市场行情,如果仅仅是擅长某一类因子或者某一个频段的预测,在多变的市场环境下可能会遭遇逆周期时出现回撤,所以机构需要捕捉市场不同周期收益来源,逐步丰富覆盖低、中、高多个频段,全频段覆盖及融合的挑战在于:1.无明显频段短板;2.平衡、分配不同预测周期的权重。有的从特征层面融合,有的从优化器层面融合,还有从组合层面融合。 10.数据显示,目前机构认为业绩归因SmartBeta超越PureAlpha,持仓收益超过交易收益.值得注意的是,1个亿以下规模量化机构(平均分5.29)和50-100亿规模机构(平均分4.55)对自己创造PureAlpha的能力给出了相对较高的评分。 11.面向未来一年,量化投研人员对未来市场的预期较为中性,部分因素略偏向乐观(如市场行情Beta走势、成交量和流动性、科技创新),而对于监管政策及舆论导向和交易、策略集中度则较为担忧。 12.极端行情期间,量化机构调整策略与未调整的人各占一半,主要调整内容包括因子权重(51.18%)、杠杆比率(49.41%)、交易执行(48.82%)、指数成分(45.88%)。调研认为本轮危机中,一些软性的实力放在了更显著的位置,排名前5的为心理韧性、危机沟通能力、团队协作、快速响应、合规风控,超越策略本身。 13.量化交易对A股市场影响方面,大多数公众认为量化交易对A股市场有积极的影响,特别是在提升市场效率(71.18%)、促进市场创新(64.63%)和增强流动性方面(79.91%)。同时,也有一定比例的公众担心量化交易可能会增加市场波动,反映了对量化交易影响的复杂性和双刃剑特性的认识。 14.四成的受访者对量化机构没有负面情绪,剩下的有情绪的公众中归因主要方向是:信息不对称(31.88%)、量化复杂性(27.51%)、媒体报道(28.82%)。 15.面对公众的质疑,7成机构选择了投资教育作为应对公众误解的主要策略。但传播与教育效果并未如预期,公众教育甚至成为机构名为保持“低调”,实为并不沟通的安慰剂,本质上是一个静默策略,实际执行过程中,自行组织视频投教仅为22.35%,部分机构甚至未与任何渠道做过任何沟通,投资者教育活动可能未能达到预期的覆盖面或深度。 16.公众对于将量化投资策略纳入个人投资组合持积极态度。多数受访者(79.04%)表达了对量化投资的信任,愿意考虑将其作为投资组合的一部分。 17.若因子与模型的经济学意义与人工智能代表两个相反方向,可以大致对量化机构派别进行划分为:传统经济学派(占比44.12%)、平衡派(占比22.94%)及人工智能派(占比33.53%),预计未来三年,这个比例会调整为20.59%:18.24%:60.59%。 18.大模型当前应用分为创造Alpha、提升效率以及投资者关系三个方面:其中最明显的作用在于思维启发、投研思路拓展(64.71%)。代码生产、编程辅助或Debug占比34.71%。 19.数据质量是限制另类数据使用最核心的因素,包括数据不完整(61.76%)缺少关键信息,影响分析的完整性。清洗难度大(48.82%)意味着需要投入更多的时间和资源。供应商杂乱(47.65%)多且标准不一,会给数据采购和质量控制带来挑战。 20.在应用另类数据的时候,量化机构最核心的还是是否具有强逻辑。量化机构需要寻找逻辑链条较短、逻辑清晰、历史更长的产业链数据或行业特有数据,目前另类数据中,结构化数据仍然是最主要的数据来源(权重占比55.29%),非结构化数据如文字、语音、视频和图像还需机构自行清理,所以应用范围较少,权重占比分别为18.88%、7.03%、11.78%。 数据来源及结构 DATASOURCEANDSTRUCTURE 量化机构版—— ■图表机构类型■图表机构当前管理规模 ■图表岗位类别 ■图表薪酬区间【总包】 ■图表薪酬涨跌幅 ■图表投资标的 社会公众版—— ■图表身份类型■图表过去一年公众投资总体盈亏情况 数据说明—— 风险提示:本次问卷受限于问卷设计、样本获取、数据整理方式,可能与实际市场情况存在偏差与测算主观性问题。 白皮书涉及问卷数据只能反映受访者对自己理解程度的主观评价,并不一定准确反映其实际能力水平。 不同受访者对评分的标准可能存在差异,因此这些数据更多地提供了一个关于受访者自我认知的总体趋势,而不是一个严格的能力测试结果。 本问卷投放暴露于量化行业或者关注量化的社会公众,其认知与态度可能存在幸存者偏差。 第一章背离与博弈 -6- 01量化与主流机构的背离 1.冲高回落几家欢喜 “冲高回落、震荡下跌”,几乎所有机构面对2023年A股市场时,都会如此形容。 2023年开年伊始,ChatGPT横空出世,引爆相关行业。下半年,俄乌冲突一波未平,巴以冲突又起,全球地缘政治割裂、动荡,叠加美联储持续加息,北向资金出现持续净卖出。 上证指数从年初3000点附近一路震荡反弹,一度攀升至3418.95点,随后二季度开始震荡起伏,三季度末收盘于3110.48 点。四季度市场一度震荡下跌,最低跌破2900点,达到2882.0点,随后震荡反弹,12月底回到2974.93点上方,年内小幅下跌3.7%。 ■图表2023年A股市场表现 资料数据来源:火富牛 2023年市场先扬后抑,板块轮动剧烈,中特估、ChatGPT、华为产业链、室温超导、北交所,各类主题昙花一现。仅剩微盘股全年表现一枝独秀。使得不管是持有型机构还是交易型机构/个人都在市场里备受煎熬。 2023年底,招商证券统计了全A个股两两相关系数中位数。发现全A个股相关性有所降低,这也为量化基金在2023年获得超额收益提供了市场条件。同时可以采用方差比检验来考察市场的定价效率,显示定价效率在2023年有所提升,有利于基于历史数据构建策略以获得超额收益。——《公募量化基金2023年度盘点:激流勇进,再接再厉》2024/01/30招商证券 主题突出、切换频繁的行情使得市场分化较明显。主观基金与量化基金风险承担和盈亏情况上存在显著差异。尤其是“大白马”、核心资产、大盘成长的基金整体表现不佳。从基金产品收益率平均值和中位数上看,主观基金与量化基金虽然各有盈亏,但量化基金的回撤、集中性表现更好。 ■图表2023年主观多头vs量化多头vs股票市场中性策略业绩分布情况 主观多头策略 量化多头策略 股票市场中性策略 公司规模 平均值 中位数 标准差 平均值 中位数 标准差 平均值 中位数 标准差 收 0-5亿 5.35% 6.88% 23.43% 2.41% 0.59% 19.79% 6.12% 4.83% 11.92% 益 5-10亿 2.48% 5.69% 23.31% 4.74% 3.75% 15.71% 10.44% 8.06% 18.39% 率 10-20亿 4.84% 6.18% 18.64% 3.69% 2.49% 10.75% 6.96% 6.84% 9.37% 20-50亿 2.77% 3.57% 15.92% 4.07% 3.76% 10.38% 6.82% 7.55% 8.63% 50-100亿 5.20% -7.94% 12.90% 5.43% 4.69% 9.31% 8.64% 7.66% 11.39% 100亿+ -1.74% 6.21% 15.97% 5.50% 4.45% 6.55% 6.67% 5.63% 4.83% 0-5亿 -23.65% -21.52% 13.89% -15.28% -12.52% 10.87% -6.36% 3.65% 6.99% 最 5-10亿 -20.29% -18.95% 10.84% -12.64% -10.95% 7.05% -3.15% -1.86% 5.22% 大 10-20亿 -20.11% -18.06% 11.57% -12.33% -11.31% 6.19% -3.90% -2.11% 6.31% 回 20-50亿 -19.10% -17.62% 10.79% -12.20% -11.74% 6.07% -4.73% -1.91% 9.63% 撤 50-100亿 -18.58% -18.3