您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[格林大华期货]:基于Barra因子的股指期货量化策略(一):初识量化交易 - 发现报告
当前位置:首页/其他报告/报告详情/

基于Barra因子的股指期货量化策略(一):初识量化交易

2022-08-16格林大华期货听***
基于Barra因子的股指期货量化策略(一):初识量化交易

研究与投资咨询部 格林大华量化研究 联系电话:0371-56518942 专题报告 2022年8月15日 基于Barra因子的股指期货量化策略(一):初识量化交易 摘要 说起量化交易,可能首先感觉是一门高深的技术,难以建立起基础认知,只能停留在名词概念,也许有这么几个原因。 首先,量化交易在国外起步比较早,发展比较成 熟,近十年来才慢慢走入中国交易者的视野。对于新事物接触的少,自然了解少一些,其实和每个细分领域的专业工种一样,非从业人员对于相关知识同样知之甚少。 其次,量化交易的研究报告中,可能出现了很多符号、公式、图表,解释说明性的文字比较少,还有阿尔法α、贝塔β、西格玛σ等希腊字母,勾起了大家学生时代对数学的恐惧。 最后,量化交易像一个黑匣子,作为一种辅助交易的工具,既看不见过程,也弄不懂原理,尤其对做法流程和金融背景不清楚。 因此,本文准备用大白话的语言,多举一些生活中的例子,跟大家聊聊量化里做法和原理,争取让没接触过量化的投资者也能看懂。 一.概述 从拆文解字的角度,量化是数量化的简称,quantify是quantity的动词化,其他类似的构词法有美化,把......变漂亮,beautiful动词化为beautify。简化,把变简单simply 动词化为simplify。同理,量化,把变成数量,就是通过一些指标设计,把隐性的问 题变为显性的数值,比如身体是否健康,通过血压、体温、心跳等数值来衡量。 第一个例子,学生考试。除了中考、高考的选拔作用之外,更多数时候是考察知识的掌握程度、自身的学习能力。这两者看不见摸不着,像是笼罩了一层迷雾一样,需要以考试试卷为媒介,以考试得分来衡量,出题和考试就是量化的过程。考试可以让自己去了解学习情况,通过优化和迭代来补齐短板,还可以揭示客观事实,通过考试发现自身兴趣,将来工作可以从事相关行业。 另外,考试与量化相似的还有层级和权重,考试的包括语数外,语文有遣词造句、诗词古文,诗词古文又分楚辞汉赋、唐诗宋词。每一个层级之间通过权重设置,考试里的权重主要是总分,一个科目的总分、阅读理解和作文的总分,一层一层向上合成为一次考试所有科目的总分,权重可以调节每一部分的重要性。考试是一个明确的层级、很完备的系统,非常全面的对知识掌握程度和学习能力做量化。 第二个例子,找伴侣和投资的相似之处是有一定的方法,但是又有法无定法的感觉,既有主观又有客观。我们所说的白富美,白相对比较容易量化的,看肤色,但是具体来说又涉及带妆不带妆,去海滩度假防晒没做好晒黑了怎么办,因此需要确定数据标准,剔除特殊情况。富也是同样,家庭资产还是个人资产,现值还是预期,需要有明确定义。美相对主观,不好量化,一定要量化的话,有个开脑洞的想法,指标设计为走在大街上路人的回头率,如果说回头也有可能是背后有熟人叫而回头,再夸张点,看有几个人走路时走着走着撞到柱子上。 以上说法真去实施的话,数据收集很困难,只是借这个例子来解释量化中需要对数据有很清晰、无歧义的定义,需要数据的清洗,怎么把主观的事情转化为客观的指标。最终,这些量化后的指标必然是从一个或者几个方面来衡量,无法甚至也无需面面俱到。 第三个例子,巴菲特投资选择盈利能力好、有护城河的美股,如果想知道同样的标准在A股有哪些公司入选。盈利能力可以用ROE或者毛利率,护城河看营收或者利润在细分行业内是否排名第一,更严格的标准是看能否比第二名加第三名还要高。在由财务指标初筛之后,可以由人来判断经营模式是否有独特优势,管理层是否为股东考虑,这种机器和人脑配合的方式,也是量化交易的一种实现模式。 在确定指标后,可以回溯2015年的财务数据筛选出来哪些股票,这些股票持有到现在是否盈利。如果盈利说明在A股市场巴菲特投资方法同样有效,把这些指标应用到2021年年报,对选出的股票重点关注。 确定指标,回溯过去,表现良好,关注现在,赢在未来,这种类似做试验的思路,就引出了下一个问题,因子回测。 二.因子回测 首先什么是因子呢?因子就是把交易方法,从某一角度,翻译为清晰具体的规则和指标。比如有些投资者的交易方法是买入强势股,这里强势股是一个相对笼统的概念,怎么样清晰具体的来定义强势股呢?可以用最近一个月的累计涨跌幅,如果一只股票累计涨了30%,其他股票或者指数只涨了10%,那么我们可以说这只股票是属于强势股的这个范围。再准确一点,一个月内的累计涨幅超越指数10%以上就定义为强势股。刚才的方法是横向和其他股票在同一时期做对比,也可以纵向的和自身做对比,比如最近一个月一只股票的股价有其最高点和最低点,如果现在的股价是越接近最高点,那么就属于越属于强势股。再准确一点,以最低点为0%,以最高点为100%,当前股价处于80%的就定义为强势股。 因子的同义词可以理解为指标、规则、标准,因子还有个近义词就是算法。比如核酸检测,我们常见的有两种办法,单人单管和十人混管,单人单管是一个最简单最直接的办法,十人混管是分为两次检测,如果第一次的十人混管里面没有阳性,就不需要进行第二次检测,万一第一次的十人混管里面出现阳性,会要把这十个人重新再进行第二次检测,很明显,在发现阳性的速度上,因为需要进行两次检测,因而十人混管的速度是慢于单人单管的。但是只要阳性率很低很低的时候,绝大部分十人混管都只需要检测一次,就可以达到节省医疗资源的效果。所以对于检测出阳性这个相同的目标,有2种 不同的办法或者说算法,选择了2种不同的路径,对应了2种不同的场景,常规筛查的时候用十人五人混管,在小区有阳性和密接的时候用单人单管。 因子是设定清晰具体的目标,算法是多快好省的实现。因为场景是千变万化的,所以算法要复杂多变尽可能适配场景。相反,因子并没有我们想象中那么高深和复杂,只需要把现实中的做法用清晰的规则语言表达出来,在这个意义上,普通投资者也是可以尝试量化交易的。 那么什么是回测呢?当我们有一个交易方法,我们想在未来赚钱,但是我们又不知道是否真的能赚钱,就像一个学生,想知道他高考是不是能考好,那我们不能直接去下定论,我们要看这个学生,他在高中三年的学习成绩是不是足够优异和稳定,他期中期末考的越好,他高考能够取得好成绩的这个可能性就越高一些。回测也是用同样的道理,看这个交易方法在过去的几年里面能不能赚钱,以此来为未来提供参考。 回测的对象是交易方法,不要直接使用结果。那么什么叫使用结果呢?我们已经知道了今年高考考了什么题,我们再回到过去再参加一次高考,那么成绩肯定很好很好啊,那么能说明年还能考的很好吗?显然是不能的,因为并没有掌握学习方法,相当于以一种作弊的方式在今年取得了好成绩。 我们说的不要使用结果,用更准确的说法,即在回测中要避免使用未来函数,什么是未来函数呢?就是现在已知的信息,在回测的那个时点尚且未知,但是被我们带入了回测中,因此产生了不准确的结果。而这种带入大多数是无意识的,就像我们看穿越剧的时候,大多数都带着现代的记忆,要把大脑里的某些信息清除掉,确实是有些困难的。比如问今年年初,上证指数3600点的时候要不要加仓,我们已经知道了后来跌破了3000 点,回答肯定是不加仓,但是跌破3000点这个信息我们在今年年初的时候是不知道的,因此在回测今年年初的交易中不能使用。 那么下一个问题,为什么要做回测?或者回测的时候挣钱了,对我们有什么帮助呢?回测有效性的理论支撑,过去是未来的一面镜子(Thepastisamirrorofthefuture),弄懂了镜子里面的,也就弄懂了镜子外面的,未来会以某种相似的方式重复过去。古人也说过,以史为鉴,可以知兴替。 在回测时能挣到钱以后,给了我们一定的信心,在未来也能挣到钱,那么在真正投 入真金白银之前,可以先进行模拟盘交易。如果说回测是回答过去应该怎么买卖,在过去和现在之间建立起联系,那么模拟盘就是在现在和未来之间建立起联系,回答明天应该怎么买,在这一点和实盘是一模一样的,区别就在于是否投入了真实资金。模拟盘就是加一个双保险,如果使用了未来函数,如果未来没有重复过去,亏损就在模拟盘里,现实中没有损失。 下一篇专题报告《基于Barra因子的股指期货量化策略(二):股票因子回测》将详细介绍多因子模型回测的流程。 重要声明 本报告中的信息均来源于公开资料,我公司对这些信息的准确性及完整性不作任何保证,不保证报告信息已做最新变更,也不保证分析师作出的任何建议不会发生任何变更。在任何情况下,报告中的信息或所表达的意见并不构成所述期货品种买卖的出价或询价。在任何情况下,我公司不就本报告中的任何内容对任何投资作出任何形式的担保,投资者据此投资,投资风险自我承担。我公司可能发出与本报告意见不一致的其它报告,本报告反映公司分析师本人的意见与结论,并不代表我公司的立场。未经我公司同意,任何人不得对本报告进行任何形式的发布、复制或对本报告进行有悖原意的删节和修改。