你的位置:论文发表 >> 论文下载 >> 计算机论文 >> 计算机理论 >> 详细内容 在线投稿

基于支持向量回归与BP 神经网络对创业板指数的预测研究

浏览114次 时间:2014年2月25日 16:43

/李伟能 黄树花

股票市场是金融业和证券业中不可或缺的重要组成部分,特别是在金融业日益发达的今天。为了更全面地反映创业板市场情况,向投资者提供更多的可交易的指数产品和金融衍生工具的标的物,推进指数基金产品以及丰富证券市场产品品种,深圳证券交易所于20106 1 日起正式编制和发布创业板指数,自从创业板开市以来,一直是投资者的热选板块。2013 11 22 日,中国证监会表示正在对未来的创业板进行研究,将适当放宽财务准入标准,制定再融资和并购重组制度。未来的创业板一定会更加成熟和稳定,这也引起了人们对创业板指数的研究,在传统方法对资产价格预测需求不足的情况下,支持向量机、神经网络的发展在资产价格预测中得到了比较广泛的应用。本文在小样本的条件下对创业板指数分别用支持向量回归和神经网络的预测模型进行了研究。

1 模型理论

1.1 支持向量回归(SVR)原理

支持向量回归的思想是通过非线性映射将输入数据映射到高维空间进行线性回归。主要有两种支持向量回归方法,分别是ε-SVRv-SVR,下面主要介绍ε-SVR。考虑如下数据集:

X={x1y1),(x2y2), xiyi},其中xi Rn 是输入向量,y R 是输出值, l 是样本数量,假设这些样本数据是相互独立的,且服从某种分布Pxy),那么数据回归的目标就是找到一个函数使得期望风险最小化:(1)其中cxyf)为基于数据集 的损失函数。由于并不知道分布函数Pxy),所以只能根据估计函数代替积分,这就是所谓的经验风险函数:(2)由于经验风险最小化很容易造成过度拟合和过度学习,于是提出了ε 不敏感的损失函数:(3)ε-SVR 转化为如下优化问题:其对偶形式为:其中。则回归函数为:其中Kxix)为核函数,主要有以下几种类型:线性核函数:多项式核函数:径向基核函数:神经网络核函数:其中γrd 是核参数

1.2 BP神经网络原理

BPback propagation)网络,也就是误差反向传播网络,它共由3 层组成:输入层、隐藏层、输出层,方向是输入层到隐藏层,再到输出层,各层之间一般采用全互连方式,如图1,相邻的两层之间通过权值相连接,根据激活函数传到输出层,这种网络可以模拟任何连续有界的函数。BP 神经网络的步骤如下:第一步,初始化神经网络模型的参数,将神经网络中的连接权值Wijλjt 和阈值θjαt 赋予在(0,1)或(-1,1)之间,并设定误差函数e,计算精度ε 和最大学习次数M;第二步,随机选取第 个输入样本及期望输出:第三步,计算隐藏层各神经元的输入与输出;第四步,利用网络期望输出和实际输出,计算误差函数对输出层各神经元的偏导数δ0(k);第五步,利用隐藏层到输出层的连接权值、隐藏层和输出层的输出δ0(k),计算误差函数对输出层各神经元的偏导数δh(k);第六步,利用输出层各神经元的偏导数和隐藏层各神经元的输出来修正连接权值wh0k),利用隐藏层和输入层各神经元的输入修正连接权值;第七步,计算全局误差,并判断网络误差是否达到所需要求,若不满足,则返回到第三步。

2 以创业板指数为例的实证分析

2.1 数据来源

本文以创业板指数2010 6 2 日到2013 11 22 日的数据为样本,如图表1,分别用支持向量回归(SVR)和BP 神经网络两种方法对开盘价预测的适用性进行分析。

2.2 支持向量回归(SVR)预测图1BP 神经网络结构图1:创业板指数2010 6 2 日到2013 11 22 日的相关指标数值日期2012-6-2 2013-11-22开盘967.61 1298.47最高997.12 1300.96最低952.61 1283.88收盘997.12 1295.07涨跌23.89 -3.89涨幅% 2.45 -0.3振幅% 4.57 1.31总手(万) 107462758 1378526000金额(亿) 4001206100 25550043000__首先,绘制出创业板开盘指数2010 62 日到2013 11 22 日的时间序列图,如图2。再将数据进行归一化处理,这主要是为了方便SVR 工具箱的应用。这里默认采用径向基核函数进行预测,经过粗略选择和精细选择两次选择,最后打印出如下结果,如表2iter 为迭代次数,nu 是选择的核函数类型的参数,obj SVM 文件转换为的二次规划求解得到的最小值,rho 为判决函数的偏置项bnSV 为标准支持向量个数,nBSV 为边界上的支持向量个数。同时得到回归预测分析最好的SVM 参数c = 1 g = 4 以及支持向量的MSE = 0.000221714。其三维立体图如图3。再利用得到的最佳参数进行SVM 网络回归预测,得到最后的MSE = 3.79×10-5 相关系数R=99.9237%,共花费了157.68 秒。可以得到原始数据和回归数据的序列图,如图4

2.3 BP神经网络预测

840 个样本数据的前640 个作为学习和训练,后200 个作为检验,经过了19 次迭代,在第13 次达到最佳,得到最好的的MSE= 5.59×10-5,时间仅用了2 秒。训练过程如图5

3 结论分析

经过比对支持向量回归和BP 神经网络的运行结果,可以知道,虽然支持向量机的训练时间要长,迭代次数要多,但是均方误差要小,并且支持向量机的训练是一个二次规划的问题,它的解是全局最优解,而BP 神经网络是基于共轭梯度算法的,它很有可能会陷入局部最优解的陷阱,基于以上分析,在对小样本进行预测和分析时,支持向量机算法在预测的精度和全局最优性问题上都比BP 神经网络算法具有一定的优势,具有更高的应用价值。2:创业板每日开盘指数时间序列图

参考文献

[1] 陈浩, 陈立辉, 毕笃彦等.BP 网络和支持向量机在非线性函数逼近中的应用[J].航空计算技术,2004,(3).

[2] 孙德厂, 史海波, 刘昶. 支持向量回归在不确定面向订单装配环境下交货期预测中的应用[J]. 航空计算技术,2013,33(8).

[3] , 杨志平, 甘志刚.SVR 算法在指数预测中的应用研究[J]. 浙江交通职业技术学院学报,2012,13(4).

[4] 夏国恩, 邵培基. 改进SVR 在金融时间序列预测中的应用[J]. 金融理论与实践,2008,11:95-98.

[5]Cao L.J,Support vector machinesexperts for time series forecasting,Neurocomputing 51(2003):321-339.

[6]Pang-Ning Tan, Michael Steinbach,Vipin Kumar, Introduction to DataMining [M]. 机械工业出版社,2010.

作者单位

云南大学数学与统计学院 云南省昆明市650091

TAG: 创业板 网络
上一篇 下一篇

论文发表与咨询

论文发表 写作指导 职称论文 毕业论文 客服联系方式:
投稿信箱:lunww@126.com
在线咨询客服QQ:站点合作85782530
在线咨询客服QQ:站点合作82534308
联系电话:18262951856
点击进入支付宝支付(支付宝认可网络诚信商家)
点击进入财付通支付(财付通认可网络诚信商家)
点击进入支付方式---->>>>

论文发表 诚信说明

论文发表 论文投稿 热点图片