在线客服系统

基于Logistic回归变量筛选的BP神经网络及应用(2)

时间:2015-05-04 13:44 来源:www.fabiaoba.com 作者:朱贺 张帆 点击:

  2.2数据清理 

  由于样本含量足够大,将近2 500例,对于存在缺失值的实例,将整条数据删除,不作分析使用。 

  2.3数据变换及离散化 

  (1)考虑到个别股票在2013年度存在除权除息,如果直接按市场价格计算股票涨跌幅,就会偏离实际情况,因此对这部分股票需要按实际收益计算其涨跌幅度。 

  (2)计算出年度股票涨跌幅后,将其离散化处理,涨跌幅(-∞,-20%],(-20%,0%],(0%,20%],(20%,+∞)分别离散为0,1,2,3四个数值。 

  2.4数据集成 

  将股票价格及涨跌数据,上市公司财务指标数据集成至一个数据库,最终得到有效数据1 856例。 

  2.5建立模型 

  构建Logistic回归模型,以步进法通过似然比统计筛选得到7个预测变量,如图3所示,再用此7个预测变量构建人工神经网络模型如图4所示。对照模型使用未使用变量筛选的人工神经网络。构建模型时,训练数据占80%,测试数据占20%。 

  2.6实验结果 

  评级总正确率较未使用变量筛选的模型,在培训和测试数据分区分别有了1.5和3个百分点的提高,分别为48.64%和50.52%;在评级=0时分别有了21和28个百分点的提高,分别为60.61%和64.63%,从ROC下方面积可以清晰看到这个变化,如图7、图8所示;在评级=3时培训分区有了5个百分点的提高,为82.8%,测试区没有提高。但在评级=1或者评级=2时正确率却有了不同程度的下降。 

  2.7实验结果分析

  使用Logistic回归筛选变量后的BP神经网络在对股票进行评级时,其评级正确率在涨幅最大区域因原模型准确率已高达77%,提升幅度不是特别大,但在跌幅最大区域却有了显著提高。其原因在于筛选后的变量扩大了影响程度较大的变量的影响,缩小了原有影响程度较小的变量产生噪声的影响,使处于涨幅极端的两类因变量特征更加明显,其分类正确率自然会有提升。而对于处于涨幅中间区域的两类因变量来说,因其涨跌幅较小,各种自变量的影响相互博弈,删减自变量,对其正确分类必然产生较大影响,降低了分类正确率。但在实际生活中,人们关心的往往是如何使利益最大化,并尽可能减小风险成本。因此,本文所提出的模型价值显而易见。 

  3结语 

  股票分级实验证明,基于Logistic回归筛选变量后的BP神经网络在保证总体分类正确率稳步提升的同时在极大、极小分类正确率上也有了显著的提高。因此,在对极值分类有较高要求且预测变量较多的应用领域,此模型可作为一种分类参考,以提高分类效率。 

  参考文献参考文献: 

  [1]SONG Y P, PENG X Q. New structure adapting neural network and its training method[J]. Control and Decision,2010,25(8):12651268. 

  [2]韩玲.基于人工神经网络—多层感知器(MLP)的遥感影像分类模型[J].测绘通报,2004(9):2931. 

  [3]韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006. 

  [4]LI Y, WANG Z, AO Z G, et al.Optimization for breakout prediction system of BP neural network[J]. Control and Decision, 2010,25(3): 453456. 

  [5]LUENGO J,GARCIA S,HERRERA F.A study on the use of imputation methods for experimentation with radial basis function network classifiers handling missing attribute values: the good synergy between RBFNs and EventCovering method[J].Neural Networks,2010,23(3):406418. 

  [6]卫敏,余乐安.具有最优学习率的RBF神经网络及其应用[J].管理科学学报,2012(4):5057. 

  [7]LIU Y Y, STARZYK J A, ZHU Z. Optimized approximation algorithm in neural networks without overtting[J].IEEE Transactions on Neural Networks,2008,19(6):983995. 

  [8]徐富强,刘相国.基于优化的RBF神经网络的变量筛选方法[J].计算机系统应用[J],2012(3):206208. 

  [9]石庆焱.一个基于神经网络—Logistic回归的混合两阶段个人信用评分模型研究[J].统计研究,2005(5):4549. 

  [10]谢远涛,杨娟,王稳. Logistic与分类树模型变量筛选的比较——基于信用卡邮寄业务响应率分析[J].统计与信息论坛,2011(6):96101. 

  [11]王国平,郭伟宸,汪若君.IBM SPSS Modeler数据与文本挖掘实战[M].北京:清华大学出版社,2014. 

  [12]徐璐.判别分析Logistic回归和BP神经网络在二分类问题中的模拟对比[J].中南财经政法大学研究生学报,2012(2):5964. 

  [13]郑睿颖,伍应环.神经网络在股票价格预测中的研究[J].计算机仿真,2011(10):393396. 

  [14]黄亦潇,邵培基,李菁菁.基于信息扩散原理运用人工神经网络识别股票级别[J].中国管理科学,2004(5):611. 


www.fabiaoba.com),是一个专门从事期刊推广期刊发表、投稿辅导、发表期刊的网站。
  本站提供如何投稿辅导、发表期刊,寻求论文刊登合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级论文刊登/国家级论文刊登/ CSSCI核心/医学投稿辅导/职称投稿辅导。

投稿邮箱:fabiaoba365@126.com
 在线咨询: 投稿辅导275774677投稿辅导1003180928
 在线咨询: 投稿辅导610071587投稿辅导1003160816
 联系电话:13775259981

联系方式
李老师QQ:发表吧客服610071587 陈老师QQ:发表吧客服275774677 刘老师QQ:发表吧客服1003160816 张老师QQ:发表吧客服1003180928 联系电话:18796993035 投稿邮箱:fabiaoba365@126.com
期刊鉴别
  • 刊物名称:
  • 检索网站:
热门期刊
发表吧友情提醒

近来发现有些作者论文投稿存在大量剽窃、抄袭行为,“发表吧”对此类存在大量剽窃、抄袭的论文已经停止编辑、推荐。同时我们也提醒您,当您向“发表吧”投稿时请您一定要保证论文的原创性、唯一性,这既是对您自己负责,更是对他人的尊敬。

此类投稿的论文如果发表之后,对您今后的人生和事业将造成很大的麻烦,后果不堪设想,请您一定要慎重,三思而后行。

如因版权问题引起争议或任何其他原因,“发表吧”不承担任何法律责任,侵权法律责任概由剽窃、抄袭者本人承担。

 
QQ在线咨询
陈老师:275774677
张老师:1003180928
李老师:610071587
刘老师:1003160816
论文刊登热线:
137-7525-9981
微信号咨询:
fabiaoba-com

友情链接

申请链接