您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:ai时代下大宗商品研究平台下的挑战与机遇20240909 - 发现报告
当前位置:首页/会议纪要/报告详情/

ai时代下大宗商品研究平台下的挑战与机遇20240909

2024-09-09未知机构x***
ai时代下大宗商品研究平台下的挑战与机遇20240909

ai时代下,大宗商品研究平台下的挑战与机遇20240909_原文 2024年09月09日21:28发言人00:00 好吧,我打开一下PPT。好的,可以了,可以开始。 发言人00:59 行,那这边黄老师从直接开始。 ai时代下,大宗商品研究平台下的挑战与机遇20240909_原文 2024年09月09日21:28发言人00:00 好吧,我打开一下PPT。好的,可以了,可以开始。 发言人00:59 行,那这边黄老师从直接开始。 发言人01:07 好的,大家下午好,我是鸿泽研阶段的黄奕。然后我来跟大家介绍一下我们的ETA投研平台的模型预测的功能。那么在讲一些在讲这个模型预测之前,我们简单跟大家讲一下我们的一些的平台。这个是我们洪泽研究过去五年多的时间吧,从研究团队的分析逻辑开始沉淀,是IT团队把研究团队的分析逻辑、分析框架做成了一个线上化的产品。使这个产品能够支撑研究团队来完成线上化的研究。 发言人01:52 我们要解决几个问题,第一个问题是研究团队的一个价值的沉淀问题。因为在当前大部分的研究团队的工作模式下,研究员的数据,研究员对数据的加工,以及研究员做的图和表格生成的报告。可能很多时候他是属于研究员个人的资产,或者说虽然研究员在公司工作,但是他的研究的逻辑在大多数情况下是非常依赖于个人的,所以它并不是一个公司全体的一个资产。所以说我们希望这个数据也好,公示,图报告是公司全体的资产,当然也是研究员个人的。这样的话我们就需要搭建一个公司全体的指标体系、分析体系图体系、报告体系。这个是我们非常核心的最初始的一个目的。第二个目的就是研究工作的规范化和透明化。 发言人02:59 就是当一个公司有统一的指标命名规则,统一的做出规则和报告规则之后它整个的研究员的研究他也会倾向于去规范,因为他的研究是透明化的,因为所有的研究都放在公司统一的平台上,研究的过程其实是比较清晰的。那么就解决一些传统excel研究模式,只知道结论。很多时候我们只知道结论并不清楚过程的这样的一个通病,这些通病其实我们自己的研究团队在几年前其实都存在。就是通过透明化的研究机制,可以去避免一些流于表面的研究。什么叫流于表面?就是可能我们仅仅把一些数据展示一下,作为一些数据跟踪,它并不是一个数据分析,这个是第一个问题,就是一个研究团队和他的价值沉淀和价值定位问题。 发言人04:00 第二个也是更加重要的,也是我们今天接下来会讲的一个重点,就是我们要提升研究的质量问题。其实我们在大多数情况下,我们做分析师的这个岗位,其实他的对这个资历的要求还是不低的,至少这个本科以上可能很多都是硕士学历。学过的内容,应可以运用的方法其实是比较多的。但是每天在excel上进行这个操作,那基本上就是初中以下的这种数学的水平,应用的技能,基本都是加减乘除,可能。更多的指标加更多的指标的减,就是相对来讲做的图表也是单一的指标的历史的走势,比较缺乏对未来的预测或者多指标的对比,大多数研究可能是被限制在本品种的范围内,缺乏一些品种外数据的关联分析。这个他并不是分析师内生性的原因。 发言人05:04 不是说分析师他不想去做一些深度的研究,而是因为这个行业的特点,要求分析师要跟踪的数据特别多,对吧?比如说一个分析师他每天要跟踪可能几百甚至上千条数据。那么光是把这些数据把它跟进到最新,把它看清楚它最新的走势,说明它最近的逻辑关联,这个可能就占了分析是大部分的时间。所以说他可能不太会有时间去做一些需要比如说编写代码,能够完成的一些深度的逻辑对吧?比如说去做一些因子的相关性,去做一些因子的拆分,因子的拟合,或者说去做对未来进行一些指标他的预测。这些的话其实是需要花大量时间的。比如说我们拿两个指标去分析它过去不同周期的关系,过去一年的你过去三年的相关性,不同错位周期下的相关系数,我就拿两个指标来去做分析,可能就要在半天的时间对吧。那如果我们用20个指标,或者说100个指标去找出里面的互相的关联,互相的逻辑关系,那可能就花的时间就更长了。 发言人06:18 其实我们这个时间成本不允许很多分析师去做特别深入的分析,这个是我们面对的问题。通过这些问题,我们需要去以一些工具来做这个应答。需要更多公司调研纪要关注公众号MT调研,可添加微信号S130970。 发言人06:45 天我们设计了一些基础的功能,这些基础的功能就是把分析师平时需要花大量时间做的基础工作,用平台来替代。什么叫基础工作呢?就是你说这个采集?每天要去采一些数据,从数据源把数据刷新一下,这一些工作。我们如果这个公司有API接口,有数据源,他就可以通过接口的方式来来完成可以通过接口的方式来完成。 发言人07:19 还有一种工作,是我们去作图和做报告,对吧?我们作图和做报告,我们会有大量的图的样式的需求,大量的样式的需求。这些做季节性图也好,做一些图表的标记,我们也可以在平台上来完成,从图到报告这样的一个展示。也有很多细节工作,我们就设计了这样的一些平台的功能。这些的话基本上在我们平台的从研报管理最终的结果,到图到表,到这个指标,一层层往前推进,这个是我们的一个基础的功能。我们也是有一些进阶的功能。还有一些进阶的功能,就是我们要做一些预测,对吧?对于这指标的预测,以及对一些相关性的分析,然后在统计分析里面,这个是我们平台的一些能力。 发言人08:23 我们说一下我们的功能的设计思路,就是为了什么目标而设计的。刚才讲的是这个比较务虚的层面,得到我们提升研究深度。从一个现实的例子,我们真实的工作场景中,什么样的研究算是有深度的研究,我们这里展现了一个研究维度的提升的过程。 发言人08:48 首先第一这个90%50%、20%这里的90%的表示有两种行业。一种是可能90%的研究员他他会做的,他能够做的。第二种含义是我们市面上看到的90%的报告里面的这个内容,可能是这样。第一个就是回顾和说明,就是解释单个变量,就是很多图虽然看起来很复杂,但是它这个图像是一个指标,或者说一个指标的季节性走势,对吧?就是说我们的报告里面,我们的这个研究过程是在解释这个单个变量,或者说我解释十个变量。但是这个十个变量我们全部是,每一个变量其实我就是单独解释他过去发生了什么事情。这个是一个回顾性的研究和说明性的研究,这种研究的话是我们最常见到的。 发言人09:51 第二总的就是往前再进一步,就我们讲初步探索,就是我们去刻画不同指标之间的因果关系,对吧?因为我们这个市场还有很多事情是A发生了以后,B大概率或者说有50%以上的概率会跟随发生。其实我们大量的时间会去研究这样的一些事件。比如说我们讲货币宽松了对价格有什么影响?那紧缩了有什么影响?虽然它不是必然的,并不是说货币宽松就会必然导致什么事情的发生。但是我们经常研究的是A货币宽松它在什么场景下,它在大概率的场景下会去引导价格的上涨。 发言人10:36 这个是我们的初步式的探索研究,其实它的维度就扩大了,但是这个难度也很高,吧?我们市场上面对的这个指标成千上万,那我怎么去确定两指标之间为我,首先我怎么去选择指标本身就是摆在大家面前的一个难题,比如说我们研究某个品种的,无论是黑色还是有色的那我们终极想要研究的是这个品种的价格。这个价格什么因素跟他相关,那我们可能在脑海中可能会去想象出一些指标,或者说我们去脑海中有这样的一个念头,宏观指标可能不是跟它相关的,宏观哪些指标跟它相关?那么我们为了分这种分析,可能就要去做做很多图,做很多表格的测算,数据的测算。这个过程其实也是比较耗时间的,所以说我们讲可能是50%的研究会去做这件事情,做探索指标之间的关联,可能做的深的,他会做到跨领域的探索。 发言人11:41 做的浅的那可能就是产品功能本身的,就是这个研究的品种本身的,或者说产业链上下游的,比如说产量和利润的关系,价格和基差的关系,库存和价格的关系,这些大家都比较容易理解的。做的深一点的话就是去跨品种的。比如说我一个美国的高频指标来怎么跟我的玻璃的需求挂钩起中间的逻辑传导链是怎么样的那这个就是我所谓的是一个初步的探索,接下来叫深度的探索。就是即便我们找到了两个指标,它能够有关联。 发言人12:22 可能我们可以看到很多很多的研究报告里面,它展现的是右上角的这个图,50%的研究会做的一些内容。但我如果我们进一步的去发掘,显然这两个图之间它是有领先和滞后的关系的对吧?比如说我们卖这个指标跟PPI之间,显然它是在波峰和波谷是不对应的,它是会错位的。那么研究两个指标之间的错位关系,或者说因果关系,或者说表面上的领先和滞后关系这种,他就提升了一个维度,或者说他是王老师,您就咱们这边的投屏的话,现在是看不到投屏吗?这边看不到,稍等一下。 发言人13:17 现在是OK的,现在OK对的。好,我们刚才还是在这张图上,就是啊左边那个是解释单个变量对吧?我们把一个变量画成一个图,右边我们这边是可能挂了两个指标,把两个指标放在一起去做研究。我们讲要拓宽这个研究面,可能我们要找更多的这个指标之间的关系。再进一步就是即便是两个同样的指标,它在历史上它的相关度都是不一样的,他都有领先和滞后的关系。有些场景下他可能是在领先五个月有相关性,或者最高的相关性。有的情况下他可能错位八个月有最高的这个项目关系。所以说就算我们手上拿到的这两个指标,我们要做的研究工作,要做的深度的探索,其实也还是非常多的,对吧? 发言人14:11 如果我们把我们想象成两个维度,第一个维度是这两个指标在多长周期内相关,这是一种维度。如果是这种维度的话,我们就需要做大量的比对?我要比对一下三个月的,比对一下六个月的,比对一下两年 的,比对一下五年?这个就会就相当于我们要画出原本只要画一张图的,现在我们可能要画出几十张图,不同的周期。 发言人14:35 第二个维度是在过去的指定的时间段内,那么指标之间错位多少?在领先两年的情在过去两年的数据的情况下,红线和蓝线?我两个指标是错位一个月相当于多少?是错位两个月还是错位三会有相关性更好?那这里又多了一个维度,多了一个特征变量。 发言人14:57 这样的话我们想象一下,如果我们要把这两个指标的关系摸清楚,我们设置十个时间段,再设置十个错位的周期,那么相当于我们对这两个指标的运算量就会提升到100元。原先从一个图,变成我们要画100张图,找到一个最好的关系。这个我们就认为我们认为它是一种深度的探索深度的探索,他可能是啊20%左右的研究,我们这里指的研究既可以是指研究员,也可以是指的是研究生成的报告,20%的研究可能会去做这些深度的探索。我们在一些券商的一些头部的券商资深的分析师的报告里面能够看到这样的一个敏感性的分析,或者说多参数的分析。 发言人15:55 再进一步其实就是要做前瞻性的,做量化的研究。前瞻性量化其实是两个是另外两个维度,就是我们刚才这三个研究做的其实都还是对指标的过去值的回溯,吧?我们希望做的是什么呢?希望是通过这个过去式的回溯发现领先的一些特征,去做预测对吧?很多虽然在大多数情况下,我们有有一种研究理念有一种研究理念认为这个市场是不可预测的对吧?指标是不可预测的。但是我们做的这个实际的内容,它就是一个指标的预测,做的实际的交易行为,我们今天做一个行为的这个交易,做一个选择,它其实本质上代表了我们对未来的一种预测,一种观点,吧。那么那能不能把这种预测做的更加的精确,用更多量化的分析方法来做,这个是我们的一个逻辑,这些逻辑链其实都会融合到我们的产品里面去,都会融融合融合到我们产品里。 发言人17:09 解释单个变量和解释两个变量的关系,和研究两个变量之间领先这个关系,其实在我们产品的已有的功能里面可以完成。可以看到我们这上的图,大部分都画的就是两个或者多个指标之间的关系。如果去寻找一些领先之后的关系,就在不同周期的多因子相关性分析,然后在统计分析模块里面,可以去完成,可以去完成。我回头也有PPT可以给大家做专门的展示。 发言人17:40 好,我们聚焦于这个预测关键变量预测这个环节。因为预测它有简单的预测,也有复杂的预测。简单的预测就是他脑袋的,比如说今年的美国的