您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:数据挖掘专题报告:支持向量机在股票价格预测方面的应用 - 发现报告
当前位置:首页/宏观策略/报告详情/

数据挖掘专题报告:支持向量机在股票价格预测方面的应用

2010-05-20国信证券晚***
数据挖掘专题报告:支持向量机在股票价格预测方面的应用

请务必阅读正文之后的免责条款部分全球视野 本土智慧 金融工程研究 Page 1 [Table_KeyInfo] 深度报告 金融工程 [Table_Title] 数据挖掘专题报告 数量化投资 [Table_BaseInfo] 本报告的独到之处  支持向量机改变了经验风险最小化原则,优于神经网络,决策树等传统数据挖掘方法。  首次使用支持向量机对A股市场的个股进行价格预测方面的应用说明。 分析师:黄志文 电话: 0755-82130833-6210 E-mail: huangzw@guosen.com.cn SAC执业证书编号:S0980206110185 分析师:葛新元 电话: 0755-82130833-1870 E-mail: gexy@guosen.com.cn SAC执业证书编号:S0980200010107 独立性声明: 作者保证报告所采用的数据均来自合规渠道,分析逻辑基于本人的职业理解,通过合理判断并得出结论,力求客观、公正,结论不受任何第三方的授意、影响,特此声明。 专题报告 支持向量机在股票价格预测方面的应用 支持向量机(support vector machine, SVM)是数据挖掘中的一项新技术,是借助于最优化方法解决机器学习问题的新工具。它成为克服“维数灾难”和“过学习”等传统困难的有效办法,虽然他还处在飞速发展的阶段,但它的理论基础和实现途径的基本框架已经形成。支持向量机目前主要用来解决分类问题(模式识别,判别分析)和回归问题。而股市行为预测通常为预测股市数据的走势和预测股市数据的未来数值。而当我们将走势看作两种状态(涨、跌),问题便转化为分类问题,而预测股市未来的价格是指为典型的回归问题。我们有理由相信支持向量机可以对股市进行预测。 本报告是支持向量机对股票价格预测应用报告的综述,旨在于介绍预测股票价格走势的SVM简单预测模型。该模型可以用来预测未来若干天股票价格的大体走势,这对于股票投资可以起到很好的指导性作用。 实证结果表明: 1、SVM简单预测模型在当所预测的未来若干天的股票价格趋于平稳上升或者下降状态时,该模型预测的效果最佳,用作预测股票价格的大体走势可信度较高。 2、然而在股票价格突然快速上涨或者下跌时,模型的预测往往不能立即跟上真实行情的变化速度,导致模拟走势与实际情况存在差异。 3、实证例子还表明在牛市和熊市中,预测效果比震荡市中的效果更为准确。原因是震荡市中所要预测的实际股票价格时涨时跌,预测的曲线存在很多的急转弯,影响了其正确性。 但一般来讲,从长远来看(50交易日),该模型还是能够描述出实际股票价格的大体走势,只是如果当预测走势的趋势不确定时,说明实际股票数据可能变化较小或震荡可能性较大,因此可以考虑不对该股票进行投资或者抛出该股票。 在应用SVM进行股票预测时,如何有效地选取输入向量的分量是决定预测模型准确性的关键。样本向量的各个分量应该选取能充分反应股票市场交易特征的定量指标,不加选择则会增加期望误差的上界。反之,选取指标过少难以刻画股票市场的特点。 2010年05月20日 请务必阅读正文之后的免责条款部分 全球视野 本土智慧 Page 2 内容目录 股市预测的发展概况 ........................................................................................ 4 数据挖掘模型的优点 ........................................................................................ 4 数据挖掘的客观性和实用性 ...................................................................... 4 数据挖掘模型 .............................................................................................. 5 支持向量机介绍 ............................................................................................... 5 概述 .............................................................................................................. 5 支持向量机的分类算法 .............................................................................. 6 支持向量机在股票市场的应用 ......................................................................... 7 基于支持向量机的简单预测模型 ...................................................................... 8 研究对象 ...................................................................................................... 8 原始数据的标准化 ...................................................................................... 8 核函数的选择 .............................................................................................. 9 输入向量的选取方法 .................................................................................. 9 参数的选择 .................................................................................................. 9 股票价格趋势预测方法 .............................................................................. 9 SVM模型的实际运用 ............................................................................... 10 实证例子分析 ................................................................................................. 11 模型的改进方案和后续拓展 ........................................................................... 15 SVM简单预测模型存在的问题 ............................................................... 15 改进方案 .................................................................................................... 16 后续拓展方向 ............................................................................................ 16 请务必阅读正文之后的免责条款部分 全球视野 本土智慧 Page 3 图表目录 图1:线性可分问题 ........................................................................................... 6 图2:近似线性可分问题 ................................................................................... 6 图3:线性不可分问题 ....................................................................................... 6 图4:浦发银行的预测走势1,07-8-6至07-8-31(20交易日) ................ 12 图5:浦发银行的预测走势2,07-6-27至07-9-4(50交易日) ................ 12 图6:浦发银行的预测走势3,08-7-10至08-9-18(50交易日) .............. 13 图7:浦发银行的预测走势4,10-2-1至10-4-27(45交易日) ................ 13 图8:常山股份的预测走势,10-1-14至10-3-31(50交易日) ................. 14 图9:中信证券的预测走势,10-2-24至10-5-6(50交易日) ................... 14 表1:实证结果统计 ......................................................................................... 15 请务必阅读正文之后的免责条款部分 全球视野 本土智慧 Page 4 股市预测的发展概况 时至今日,在金融经济学的发展上人们对金融预测作了大量的探索,取得了丰硕的成果。典型的金融预测是时间序列预测。时间序列的典型特征是相邻观测之间的依赖性。为了研究这种依赖性,人们提出了许多时间序列模型,并对这模型的性质及分析方法进行了深入的研究。传统的金融时间序列大致上有两种研究方法,一种方法是从基本的经济原理出发建立金融时间序列服从的数学模型,像Markovitz的投资组合理论,资本资产定价模型(CAPM)、套利定价理论(APT)、期权定价模型等。实际上,这部分成果就是确定金融时间序列的趋势项。这些理论,理论上很成功(有三项获得诺贝尔经济学奖),但它们都是建立在很理想的假设上,而这些假设与市场的实际情况有很大差距,所以这些理论在实际效果中并不理想。另一种方法是从统计角度对金融时间序列进行研究。这种方法直接从实际数据出发,应用概率统计推断出市场未来的变化规律。虽然这种方法从经济学角度来讲缺乏理论性,但是在实际应用中效果较好。而且,统计方法还可以对经济模型的好坏进行检验和评价。二十世纪80年代以前,人们对时间序列的研究主要集中在一种线性模型,即自回归移动平均模型(AutoRegressive MovingAverage Modes,ARMA),这种模型结构简单,有着完善的统