NBER工作文件系列 从人VS。机器到人+机器:股票分析的艺术和人工智能 SeanCaoWeiJiang 王宝忠杨俊波 工作文件28800http://www.nber.org/papers/w28800 国家经济研究局 马萨诸塞州大道1050号剑桥,MA02138 2021年5月 作者受益于与SvetlaaBryzgalova,WillCog,JilliaGrea,GerryHoberg,MarsPelger,SiewHogTeoh和ChristiaZh的讨论,以及CKGSB和StafordEgieerigAIBigDataiFiaceResearchForm(ABFR)网络研讨会的研讨会/会议参与者的意见和建议。本文表达的观点是作者的观点,不一定反映国家经济研究局的观点。 NBER工作文件出于讨论和评论目的而分发。它们没有经过同行评审,也没有经过NBER官方出版物随附的NBER董事会的评审。 ©2021作者:SeanCao,WeiJiang,JunboL.Wang,andBaozongYang.Allrightsreserved.Shortsectionsoftext,innotexplicitlypermission,maybequotedwithoutexplicitpermission,suppliedthatfullcredit,including ©notice,isgivento 从人与机器到人与机器:股票的艺术与AI分析曹海,姜伟,王俊波和杨宝忠NBER工作文件第28800号2021年 5月 果冻号G11,G12,G14,G31,M41 摘要 我们建立的AI分析师消化公司财务信息,定性披露和宏观经济指标,能够在股价预测中击败大多数人类分析师,并比跟随人类分析师产生超额收益。在“人与机器”的竞争中,当公司复杂,信息高维,透明和大量时,AI分析师的相对优势更强。当关键信息需要机构知识(例如无形资产的性质)时,人力分析师保持竞争力。当分析师获得替代数据和内部AI资源时,AI相对于人类分析师的优势会随着时间的推移而下降。人工智能的计算能力和人类理解软信息的艺术相结合,在生成准确的预测方面产生了最大的潜力。我们的论文描绘了高技能职业中“机器加人”(而不是人类流离失所)的未来。 SeanCao J.MackRobinson商学院佐治亚州立大学35BroadStreet,1243套房 亚特兰大,GA30302-3992scao@gsu.edu 姜伟 哥伦比亚大学商学院 3022Broadway,UrisHall803纽约,NY10027 和NBERwj2006@columbia.edu 王俊波商学院 路易斯安那州立大学巴吞鲁日,洛杉矶70803junbowang@lsu.edu 杨保中乔治亚州立大学 J.MackRobinson商学院BroadStreet35 号套房1243 亚特兰大,GA30303bzyang@gsu.edu 1.Introduction 自成立以来,随着人工智能(AI)的兴起,它不断使人类重新思考自己的角色。虽然人工智能旨在增强人类的智力,但人们仍然担心人工智能可以取代人类的任务和越来越熟练的任务,从而取代目前由高薪和受过良好教育的工人执行的工作(Mro,Maxim和Whito,2019)。这种关注和相关的辩论促使文学迅速增长。Webb(2020),Acemogl,Ator,Hazell和Restrepo(2020),Babia,Fedy,He和Hodso(2020)以及Jiag,Tag,Xiao和Yao(2021)的最新工作都对工作暴露程度和对AI相关技术的脆弱性以及对就业和生产力的影响进行了大样本分析。 现有的文献主要集中在描述容易受到AI进化破坏的工作类型以及可能因AI进化而产生的工作类型。换句话说,现有研究的观点大多涉及“人与机器”的主题。Procedres.,描述人类和人工智能之间的竞争,探索人类适应的方式,并预测由此产生的工作重新部署。在这样的环境中,人类往往变得被动或被动——应对干扰,寻找人工智能环境定义的新机会。关于如何通过增强AI技术来发挥更高的潜力的研究相对较少 ,这可能是人类设计和开发AI的主要目标。本研究旨在将“人与机器”(“人。 v.机器“以下)达到“人加机器”(以下为“人+机器”)的潜在平衡。 我们的研究可能受到国际象棋大师加里·卡斯帕罗夫的经验的推动。IBM的深蓝在1997年击败当时的大师卡斯帕罗夫的故事是众所周知的。此后,在类似的环境中重复进行了多次比赛,从而消除了国际象棋中人与机器的结果的任何悬念。鲜为人知的是 人类尽管对人机国际象棋比赛失去了兴趣,但对游戏或机器都没有失去兴趣。实际上,与深蓝的相遇是像卡斯帕罗夫这样的人开创人与机器比赛概念的催化剂,在这种比赛中,配备AI辅助的国际象棋选手(“半人马”选手)与AI竞争。到今天为止,半人马在机器上占据了上风;更令人鼓舞的是,随着负担得起的AI工程国际象棋程序的出现,有越来越多的人类国际象棋棋手。1如果人工智能可以帮助更多的人成为更好的国际象棋棋手,那么它可以帮助我们中的更多人在许多熟练的工作中变得更好,从飞行员、医生到投资顾问。在这项研究中,我们放大了股票分析的专业,其数据可用性使我们能够校准人与机器和人+机器。股票分析师是市场上最重要的信息中介机构之一(例如Procedre,Brav和Lehavy,2003;Jegadeesh,Kim,Krische和Lee,2005;Crae和Crotty,2020)。他们的工作需要机构知识和数据分析,但人工智能并没有幸免,因为越来越多的投资者开始关注人工智能工具提出的关于股票选择和投资组合形成的建议。2 为了找出从“人对机器”到“人+机器”的路径,我们决定 构建我们自己的AI模型,用于年终股票预测,以便我们为我们理解并能够解释的AI性能提供一致且适应时间的基准。3目标价格和收益是分析师预测的两个主要主题,我们选择前者,因为后者受管理自由裁量权的约束,这是关于盈余管理的大量会计文献所体现的。我们的“AI分析师”是建立在培训com- 1信息来源:《不可避免的》,由KevenKelly,企鹅出版集团,2016年。 “击败国际象棋冠军加里·卡斯帕罗夫与人工智能实现了和平”,连线,2020年2月。 2资料来源:“机器学习对资产经理意味着什么”,RobertC.Pozen和Jonathan Ruane,《哈佛商业评论》,2019年12月3日。“创业投资者如何利用人工智能进行更明智的投资”,贾·沃茨,福布斯,2019年1月18日。 3我们关注年终价格,因为这是投资者和企业的典型焦点 税收和报告原因。例如,“瑞士信贷提高了其SP500目标-收益太好了,不容忽视”,JacobSonenshine,Barron's,2021年4月30 日。 当前机器学习(ML)工具包的组合4及时使用公开的数据和信息。更具体地说,我们收集公司层面,行业层面和宏观经济变量,以及来自公司披露的文本信息(更新到分析师预测时间之前)作为输入或预测因子 ,但故意排除分析师预测(过去和当前)本身的信息。我们求助于机器学习模型,而不是传统的经济模型(如回归),因为前者在管理高维非结构化数据方面具有优势,并且在优化和拟合未指定的功能形式方面具有灵活性。该领域的最新发展也使我们能够减轻过度拟合并提高样本外性能。 我们一直在训练和改进模型,直到我们确信我们的AI分析师能够在整体上击败人类分析师:基于最终“集合”模型的AI分析师在2001-2016年的样本期内超过了所有IBES分析师的目标价格预测的53.7% 。5此外,根据人工智能和人类分析师的观点差异,每月重新平衡多空投资组合6使用Fama-Frech-Carhart四因素模型,能够产生0.84%至0.92%的月alpha。虽然建立一个人工智能分析师不是这项研究的最终目标,虽然我们并不声称我们的人工智能分析师是最好的,但它的表现已经表明,金融分析师的职业受到技术中断的影响,因为我们的模型是最先进的下限。在某种程度上,我们拥有一位超过人类同行平均水平的人工智能分析师,我们能够探索双方的相对优势和潜在协同作用。 首先,我们研究了人类分析师保留其优势的情况,因为分析师做出的预测在较低的方面超过了并发 AI预测 4我们从两个通用的准线性ML模型开始,弹性网络和支持向量回归,它们擅长具有大量变量的任务。然后,我们添加了三个高度非线性的ML模型,随机森林,梯度提升和长短期记忆(LSTM)神经网络。随机森林和梯度提升都可以捕获输入变量之间的复杂和分层交互,而LSTM模型旨在对数据中的时间序列模式进行建模。 5相比之下,OLS模型的预测仅超过分析师预测的19.3%。 6如果AI预测的目标价格高于分析师中位数,那么这样的投资组合将做多股票在一个时间范围内进行预测,否则做空一只股票。 相对于事后实现的绝对预测误差(i.Procedres.,实际年终股票价格)。我们发现,对于流动性较差,规模较小的公司以及具有轻资产商业模式的公司,人类分析师的表现更好(i。Procedres.,较高的无形资产),与此类公司受更高的信息不对称影响并且需要更好的机构知识或行业经验来破译的观念一致。隶属于大型经纪公司的分析师也有更高的机会击败机器,这是他们的能力和可用研究资源的结合 。此外,当相关行业经历困境时,分析师更有可能占据上风,这表明人工智能尚未赶上行业衰退等相对罕见的变化。这与当前机器学习和AI模型的局限性一致,这些模型缺乏推理功能,因此无法从罕见的事件中有效地学习。7正如预期的那样,人工智能在处理信息的能力方面具有明显的优势,当公共信息的数量较大时,人工智能更有可能成为智能分析师。 就像卡斯帕罗夫开创的“半人马”棋手一样,卓越的表现人工智能分析师的观点并不排除人类输入的价值。如果人和机器在信息处理和决策方面具有相对优势,那么人类分析师仍然可能对“半人马”分析师做出关键贡献。Procedres.,一位分析师,将自己的知识和AI模型的输出/建议结合起来进行预测。在我们将分析师预测添加到AI分析师基础的机器学习模型的信息集中之后,所得到的“人+机器”模型的预测优于分析师做出的57.3%的预测,并且在所有年份都优于仅AI模型。因此,人工智能分析师还没有取代人类分析师;事实上,结合人工智能的计算能力和人类理解软信息的艺术的投资者或分析师可以获得最佳性能。因此,我们有兴趣知道人与人+机器模型的增量价值何时最高,这表现在人+机器模型与纯AI模型的相对性能上。与之前的发现类似,我们从分析 师那里找到了投入。 7来源:“AI仍然不能做什么”,BrianBergstein,麻省理工学院技术评论,2020年2月19日 当覆盖流动性更差的公司和有形资产更多的公司时,它们更有价值。此外,分析师的投入在长期预测中具有更多的增量价值,并且在此期间,行业遇到了困难。重要的是,人类的增量价值不会随着信息量(因此对处理能力的需求)的增加而减少,尽管这在单独使用时构成了人类的缺点。同样,与大型银行的分析师相比,小型经纪行的分析师对人+机器模型的贡献水平相似,这表明人工智能可能有助于弥补机构资源的差距。 最后,我们诉诸事件研究,以加强对在股票分析中集成人与机器的影响的推断。近年来,“大数据”的基础设施创造了一类新的公司信息,这些信息是在公司之外收集和发布的,这些信息为投资机会提供了独特而及时的线索。一种重要且流行的替代数据可以捕获“消费者足迹”,通常是字面意义上的,例如零售停车场的卫星图像。这些数据必须由机器学习模型处理,已被证明包含股票价格的增量信息(Zh,2019;Katoa,Paiter,Patatoas和Zeg,2020)。我们基于Katoa,Paiter,Patatoas和Zeg(2020)的数据 ,交错引入了几个重要的替代数据库,并对分析师的表现与我们自己的AI模型进行了差异测试。基本前提是,覆盖由替代数据提供服务的公司的分析师可能处于人+机器的情况,因为他