欢迎来到速发表网,咨询电话:400-838-9661

关于我们 登录/注册 购物车(0)

期刊 科普 SCI期刊 SCI发表 学术 出书

首页 > 优秀范文 > 统计与预测论文

统计与预测论文样例十一篇

时间:2023-03-20 16:24:46

统计与预测论文

统计与预测论文例1

二、评估预测系统的开发研制

(一)基本原理与方法

如何实现评估过程从定性到定量的转变,是开发研制该系统的关键所在。我们依据高等教育评估的原理,采用模糊综合评价的基本原理和方法,给出了建筑工程专业毕业设计(论文)评估的量化模型,具体步骤如下:

1.建立毕业设计(论文)评估指标体系。一级指标分为教师、学生、选题、客观条件四个方面。各方面再细分则为二级指标,如:教师方面分为准备工作、课堂讲授、出勤率、答疑情况、教学方式、教师职称等六个方面;学生方面分为学习态度、平时成绩、计算书完成情况、图纸完成情况、创新情况、译文完成情况等六个方面;选题方面分为结构类型、课题新颖程度、计算机应用合理程度、题目性质、外文资料、创新性等六个方面;客观条件分为设计教室、绘图仪器及图板、机房及出图设施、每位教师指导学生人数等四个方面。

2. 设立评价等级V,V=1好(VI),较好(V2),—般(V3),较差(V4)|。

3. 构造单因素评判矩阵R,

其中,R中每一个元素rij表示第i个评价因素对第j个评价等级的隶属度。

4. 设立各评价因素权重集A,例:一级指标权重集八=(0_35,0.35,0.15,0_15),八的取值可根据经验,并依据以往各届毕业设计(论文)评估结果经反复试算确定。

5.计算综合评判矩阵

    

6.对各级指标体系重复步骤

     7.计算测评结果

    

求得最终评判矩阵B该量化模型针对毕业生总体进行评估,评价毕业生的综合质量,改变了过去仅片面地对个人进行评估的状况。

(二)评估预测系统的计算机开发语言

系统采用流行的Windows人机交互式界面,力争做到界面友好,操作方便。根据本系统的特点和具体要求,我们选用了Windows环境下的VisualBasic5.0可视化编程语言开发本系统。VisualBasic5.0是微软公司开发的功能十分强大而又简单易用的可视化编程环境,编程速度快,界面质量高,是编写Windows应用程序的最佳选择。使用VisualBa¬sic语言开发本系统充分体现了本系统处理数据、信息快捷方便的特点。

(三)评估预测系统的总体结构

在Windows操作系统下安装本系统后,启动系统,进人主菜单,依据界面提示您就可以轻松完成评估工作,系统主框图如下:

三、评估预测系统的优点

1. 量化评估,提前预测,动态管理。该计算机辅助评估预测系统能够对毕业设计(论文)工作方案可能取得的效果进行预测。教学管理人员只要依据该系统的提示输人各项有关毕业设计(论文)工作方案的参数,系统随即能计算出毕业设计(论文)工作的成绩,从而对各项工作方案的结果作出预测。通过反复改变参数——计算成绩,教学管理人员就能够发现各种方案的优缺点,即哪一项安排对毕业设计(论文)工作是有利的,如果实施下去会取得好的工作效果;哪一项安排对毕业设计(论文)工作是不利的,实施下去必将导致毕业设计(论文)工作成绩下滑。这种预测如果安排在毕业设计(论文)工作开始之前,管理者就能有效地对毕业设计(论文)方案进行调整,从而获得满意的效果。我们将99届与往届的工作方案作了一下比较,发现由于老教授退休较多,本次毕业设计年轻教师比例上升,但年轻教师职称偏低,讲师居多,教授、副教授比例严重下降,用该系统初步预测发现毕业设计整体质量将要下滑。根据这个信息,系学术委员会马上采取措施,对年轻教师提出更高要求:指导教师中讲师一级必须具有硕士学历,且应有一定的工程实践经验,在课题选择及指导上必须具有较强的创新性,最后经系学术委员会严格审查后方可上岗。再用本系统预测后发现,毕业设计(论文)工作最终得分并未降低,反而稍有提高。目前,99届毕业设计(论文)工作已经结束,最终得分的确较98届有所提高,与系统预测结果吻合较好。

2. 有效监督,对症下药。毕业设计(论文)工作进行到中期时,系里为了加强对毕业设计(论文)工作的监督管理,一般要求安排一次中期检查。该检查能发现一些问题,但对这些问题造成的结果却很难预知。这样的话,发现缺点往往不能及时纠正,任其发展下去必将导致不良后果。这时,如果用该计算机辅助评估预测系统进行一下“中期评估”,各种问题可能导致的结果将一览无遗,且该系统会帮助教学管理人员清楚地发现各种导致毕业设计(论文)工作成绩偏低的原因,从而有针对性地,高效率地对缺点进行纠正,对优点给予肯定,保证毕业设计(论文)工作顺利进行,最终取得优异成绩。例如,99届某老师所带设计组,由于指导教师出勤率过低,中期检查时系统评估预测该设计小组成绩偏低,系领导马上对指导教师进行了批评教育。由于纠正及时,最终这个小组成绩达到了总体平均成绩。

统计与预测论文例2

关键词:变形监测; 灰色系统; 灰色预测模型

中图分类号:O141.4 文献标识码:A 文章编号:

1 引言

MATLAB源于Matrix Laboratory一词,原意是为矩阵实验室,是由John Little和Cleve Molar共同成立的美国Math Works公司推出的一种集数学、图形处理和程序设计语言于一体的科技应用软件。它把科学计算、结果的可视化和编程都集中在一个使用非常方便的环境中。在这个环境中,用户的问题和得到的结果都是通过用户非常熟悉的数学符号来表达的。MATLAB系统包括几个组成部分:MATLAB语言、MATLAB工作环境、MATLAB工具箱和MATLAB的API。MATLAB以向量和矩阵为基本数据单位,被称为第4代计算机语言,有着其他一些语言所无法比拟的特点:功能强大;语言简单;扩充能力强、可开发性强;编程容易、效率高。它已在国内外高校、科研机构和工程技术上得到了广泛的应用[1]。

灰色GM(1,1)预测模型在计算过程中主要是以矩阵为主,它和MATLAB的结合可以有效的解决了灰色系统理论在矩阵计算中的问题,为灰色系统理论的应用提供了一种新的方法[2]。

2GM(1,1)预测模型的MATLAB部分源程序

根据上述GM(1,1)模型的数学思想,结合MATLAB语言的特点编制了一套可读性强,容易理解的预测程序。该程序操作简单灵活,稳定性好,直接面向用户。只要输入原始数据,就可得到预测值和预测值与实测值比较图形。

3工程实例应用

3.1 数据资料

将卧龙寺新滑坡的5号裂缝变形观测数据作为GM(1,1)预测模型程序的原始输入值。其变形时序见表3-1

表3-1 卧龙寺新滑坡位移检测资料(5号裂缝)

预测结果:

在MATLAB平台下,输入表1中的数据即x=[1.0 1.5 1.7 2.5 3.2 4.0 4.4 5.1 5.9 6.3 7.0 7.3 7.8 8.2 8.4 8.7 9.0 9.4 10.0],然后调用所编制的文件gm.m,即可得出该预测模型的预测值和有关参数。结果如表4-2:

表3-2 卧龙寺新滑坡5号裂缝实测位移量与预测值(mm)

运行成果图如下:

图3-1.卧龙寺新滑坡5号裂缝原始数据与GM模型预测值比较 图3-2. 新滩滑坡体原始数据与GM模型预测值比较

3.2 数据资料2

1986年6月12日,长江西陵峡新滩镇发生了一次较大规模的滑坡,即新滩滑坡。将其关键部位A点的位移时序观测值作为GM(1,1)预测模型程序的原始输入值。其变形时序如表3-3

表3-3 新滩滑坡体A测点位移观测资料(mm)

预测结果:

在MATLAB平台下,输入表1中的数据即x=[0.077 0.092 0.615 0.65 0.69 0.738 0.846 0.962 1.0 1.03 1.061 1.077 1.1 1.23 2.46 2.754 2.83 2.92 3.46 4.00],然后调用所编制的文件gm.m,即可得出该预测模型的预测值和有关参数。结果表3-4:

表3-4 新滩滑坡体A测点位移实测位移量与预测值(mm)

4 结论

变形测量值是已发生的变形量,但更重要的是通过对变形观测资料的处理,从现有的数据中预报出下一时刻的变形值,以判断工程的安全状况。本文结合工程实际,探讨了变形监测方案设计、监测数据处理等问题,应用灰色系统理论对建筑物原型观测资料进行了分析;同时,运用MATLAB程序软件编制了GM(1,1)灰色预测模型程序。总结本文,得出以下主要结论:

1.在全面评述变形监测的目的、方法以及变形监测完整过程的基础上,总结归纳了变形观测点位的布设、观测周期的确定原则和方法;指出以允许变形值的安全度为依据来确定变形观测精度指标是一条新途径。

2.针对建筑物时效变形具有一定的单调性和弱随机性,引入灰色系统理论。在一般灰色模型建模特点的基础分析上,建立了灰色预测模型,并将其应用于工程实践中。

3.应用MATLABRUA软件编制了灰色预测模型及精度检验程序.MATLAB是专用的矩阵计算软件,对矩阵的计算有很好的效果,而且用起来比较容易简单,还可以允许用户编程对功能进行扩展。

4、灰色GM(1,1)预测模型在计算过程中主要是以矩阵为主,它与MATLAB的结合解决了它在计算中的问题。由以上的实例可以看出,用MATLAB编制的灰色预测程序简单实用,容易操作,预测精度较高,而且可以直接绘出直观的二维折线图,为用户参考。

参考文献:

[1]周 卫. 基于MATLAB的灰色系统沉降预测. 测绘通报,2002(6):34~36

[2]邓聚龙.灰色系统.北京:国防工业出版社,1985

[3]尹晖等.灰色动态预测方法及其在变形预测中的应用.武汉测绘科技大学学报,1996

统计与预测论文例3

一、引言

证券分析师是依法取得证券投资咨询执业资格,并在证券经营机构就业,主要就与证券市场相关的各种因素进行研究和分析,包括证券市场、证券品种的价值及变动趋势进行研究及预测,并向投资者证券研究报告、投资价值报告等服务的专业人员。盈利预测,是分析师工作的一个重要方面。作为目前最受关注的预测类信息,盈利预测信息通过反映企业在预测期间内可能达到的营业收入、利润总额、净利润、每股收益水平等,帮助投资者、债权人以及其他相关使用者评价企业未来现金流量的时间、金额、不确定性,从而做出合理的经济决策。相比于国外成熟的资本市场,我国的证券机构及其分析师行业仍然处于起步发展阶段,证券分析师的分析和预测能力和国际上资本市场发达的国家的证券分析师相比还有相当的差距。

本文从实证的角度检验我国证券分析师盈余预测的相对准确性及改进模型的准确性,不但有助于投资者更为科学地审视证券分析师的盈余预测,而且为证券分析师提供了结合统计模型进行盈余预测的思路。

二、文献回顾及问题的提出

一个公司的内在价值取决于其未来的盈利能力,而盈余预测揭示的正是这个问题,一个准确的盈余预测能够帮助资本市场上众多的投资者合理审视上市公司的价值并作出合理的判断。盈余预测一般来自以下三个途径:公司管理层、证券分析师和统计模型。我国盈余预测的来源主要是后两者。

检验证券分析师盈余预测与统计模型的相对准确性意在判断证券分析师预测的价值,除少数早期研究,国外大多数相关研究证明了证券分析师盈余预测的相对优势。且Brown等研究者认为分析师盈利预测较统计模型准确的原因主要有三类:一是分析师具有对新信息做出反应的适时性优势(timing advantage);二是分析师具有卓越的股票分析能力;三是分析师具有信息资源优势。鉴于我国资本市场并不是很成熟且证券分析师的能力有限,上述结论是否在我国成立具有较大的现实意义

问题一:证券分析师作出的盈余预测与统计模型相比哪个更为准确?

虽然大多数研究表明分析师盈利预测较统计模型预测准确,但这并未就此否定统计模型预测的价值。不少研究者(Cheng、Fan&So,2003;Conroy& Harris,1987;Newbold、Zumwalt&Kannan,1987)指出,分析师盈利预测并不能提供完整的预测信息,最理想的状态是分析师在盈利预测时能结合使用统计模型,由此可能获得更准确的预测数据。目前,我国还没有这方面的研究,如果证券分析师预测和统计模型预测的结合能够提高盈余预测的准确性,那无疑将提高投资者对上市公司更为准确的认识。

问题二:将证券分析师和统计模型相结合的改进模型是否能更有效地预测每股盈余?

三、研究设计

(一)样本选择

本文的证券分析师盈余预测数据及上市公司实际盈余数据均来自国泰安经济研究服务中心,我们选取了数据库中2009.1~2010.3所有券商对上市公司2009年12月31日每股盈余所作的预测数据,及1991~2009年上市公司的实际每股盈余数据。因为国泰安数据库中只记录了分析师对438个上市公司的盈余预测数据,所以我们只选取了这些公司的实际盈余数据,并且对于同一券商对同一公司的多次预测,我们只选取最后一次预测的数据,一共得到3776次。

(二)证券分析师与统计模型的准确性比较

这里的统计模型我们选用一次指数平滑法,并以年度数据和季度数据分别来预测2009年12月31日的每股盈余,称为年度统计模型和季度统计模型。

证券分析师与统计模型的相对准确性用证券分析师预测盈余的误差绝对值和统计模型预测盈余的误差绝对值的差值来表示,即RR=TFtf-AFaf。

其中AFaf是证券分析师盈余预测的绝对误差,AFaf=Aaf-RE,TFtf为统计模型盈余预测的绝对误差,公式为TFtf= Ttf-RE,RE为实际盈余。

由上述模型可知,当RR大于零时,统计模型的绝对误差大于证券分析师预测的绝对误差,即证券分析师的预测更为准确;当RR小于零时,证券分析师预测的绝对误差大于统计模型的绝对误差,即此时统计模型预测更为准确。在判定RR的正负性时,用T检验来测试其正负性的显著性。

(三)改进模型的准确性检验

我们将改进模型定义为证券分析师和统计模型的均值,即改进模型的预测值为Ggf=,则其绝对误差为GFgf=Ggf-RE。在检验模型的准确性时,我们依旧用两种模型(改进模型与上述表现最好的模型)的绝对误差的差值来判定。

由于存在年度模型和季度模型,所以这里的改进模型也有基于年度数据的年度改进模型和基于季度数据的季度改进模型。

四、实证分析

(一)数据描述

本文采用的预测数据来自国泰安经济服务中心,是99家券商对439家上市公司的每股盈余作出的预测,一共涉及3776次预测。

由于上市公司2009年的年度财务报表一般在次年4月份公布,所以我们选择盈余预测数据的区间为2009年1月份至2010年3月份,并且对于同一券商对同一上市公司作出的多次预测,我们只选取最后一次的数据。对15个月份的预测数据统计如表一。由表数据可知随着时间的推迟,分析师预测的平均误差越来越小,即准确性越来越高。这是因为随着会计截止日的到来,市场上的信息会越来越多,如季报、半年报的公布等,且证券分析师除了能获得市场上的公开信息外,还能通过所特有的渠道获得越来越多的私有信息,并根据信息及时修正前期的预测数据,使预测值更接近实际值。

(二)证券分析师与统计模型的准确性比较

关于证券分析师与统计模型预测的准确性比较,我们先将三个模型的绝对误差进行统计描述,如表二。由表数据可知,年度统计模型的绝对误差均值0.252远远大于分析师模型的绝对误差均值0.1392,且其标准差和中位数也大于分析师模型,表明年度统计模型的绝对误差分布较分析师预测的绝对误差分布分散。而基于季度数据预测的绝对误差均值0.1742虽然比分析师预测的绝对误差均值0.1392大,但其标准差较分析师模型的小,表明季度统计模型的绝对预测误差虽然大,但误差分布集中。对于年度统计模型和季度统计模型,不管从均值、中位数还是标准差的角度,季度统计模型都要优于年度统计模型。

要比较证券分析师与统计模型的相对准确性,我们还要对RR进行统计描述,看其是否显著大于零或小于零,结果如表三。表中的T检验是在a=0.1水平上的单侧检验。由结果知,RR1无论在均值还是中位数上,都显著大于零,表明年度统计模型的绝对误差显著大于分析师预测的绝对误差。而基于季度数据的RR2的均值和中位数也显著大于零,但由于其在均值和中位数上都比RR1有所减小,所以虽然季度统计模型的绝对误差显著大于分析师预测的绝对误差,但分析师预测在这儿的优势比与年度统计模型的优势小。

其中RR1表示的是年度统计模型与分析师模型的绝对误差的差值,RR2表示季度统计模型与分析师模型的绝对误差的差值。

(三)改进模型的准确性检验

这里的改进模型也分为两类,一是基于年度统计模型和分析师模型的年度改进模型,二是基于季度统计模型和分析师模型的季度改进模型。我们先对改进模型的绝对误差进行统计描述,并分别与分析师模型和统计模型进行比较,结果见表四。年度改进模型的均值和标准差相对于年度统计模型已大大减小,但相对于分析师模型还是未能超越。而季度改进模型在均值、标准差和中位数上都小于分析师模型和季度统计模型,作为改进模型,季度改进模型比年度改进模型更优。

由上文分析可知,分析师模型预测的准确性高于年度统计模型和季度统计模型,所以接下来我们要分析年度改进模型与分析师模型、季度改进模型与分析师模型的相对准确性,RR3、RR4的统计描述结果如表五。T检验是a=0.1水平上的单侧检验。可知AA3中的均值和中位数显著大于零,表明年度改进模型的绝对误差显著大于分析师模型的绝对误差,即分析师预测的准确性显著高于年度改进模型。而RR4中的均值和中位数显著小于零,表明季度改进模型的绝对误差显著小于分析师预测的绝对误差,即季度改进模型显著优于分析师预测模型。

其中RR3是年度改进模型的绝对误差与分析师模型的绝对误差的差值,RR4是季度改进模型的绝对误差与分析师模型的绝对误差的差值。

总的来说,在我们的研究样本中,证券分析师盈余预测的优势是存在的,但只是相对于一个简单的统计模型而言,如果将分析师的预测和统计模型的预测结合起来(如本文中的简单均值),就可能得到能击败分析师和统计模型的改进模型,这对证券行业中如何提高证券分析师盈余预测准确性具有实际意义。

五、结论与启示

本文使用2009.1~2010.3年99家券商对438家上市公司作出的3776次盈余预测,考察了证券分析师的盈余预测是否优于统计模型的预测,即证券分析师预测的相对优势,且建立了结合证券分析师和统计模型的简单改进模型,并检验了其相对准确性。结果表明,我国证券分析师的预测显著优于统计模型的预测,其中以季度数据为基础的季度统计模型又优于以年度数据为基础的年度统计模型。并且,结合证券分析师和季度统计模型的简单改进模型的预测误差显著小于证券分析师的预测误差。

本文的研究结论对证券分析师和投资者有一定的借鉴意义。证券分析师除提高自身的预测能力外,还需要结合统计模型以弥补本身主观因素所造成的影响。对于投资者,本文的建议是正确对待证券分析师等所的预测报告,理性判断,不能盲目以此为准。

本文的研究还有很多不足的地方,如在选取统计模型时,只选择了一次指数平滑法这一种模型,并且在改进模型时只讨论了简单均值。在以后的研究中,关于统计模型还可选择随机游走、二次指数平滑等模型,在改进模型时也可赋予证券分析师预测和统计模型预测不同的权重。

虽然国外在证券分析师预测方面已有很多的研究,但毕竟国内的资本环境和发展进度与国外有一定的差异性,所以我们不能照搬国外的研究成果,而是应该结合国外研究成果和国内实际情况进行实证研究。

参考文献:

[1]Robert Conroy and Robert Harris,Consensus Forecasts of Corporate Earnings:Analysts' Forecasts and Time Series Methods,Management Science,Vol.33.No.6,June 1987

[2]Salvatore.J.Terregrossa,Combining Analysts'Forecasts with Causal Model Forecasts of Earnings Growth,Applied Financial Economics, 1999, 9, 143-153

[3]Newbold,P,J.K.Zumwalt and S.Kannan,bining Forecasts to Improve Earnings Per Share Prediction.Internatinal Journal of Forecasting 3:229-238

统计与预测论文例4

中图分类号:TM 文献标识码:A 文章编号:1009-914x(2014)08-01-01

0 前言

电力负荷预测是电力系统调度、用电、计划、规划等管理部门的重要工作。有效地提高负荷预测结果,有利于计划用电管理,有利于机组检修计划和合理安排电网运行方式,有利于节煤、节油和降低发电成本,有利于制定合理的电源建设计划,有利于提高电力系统的经济效益和社会效益。因此,负荷预测已经成为实现电力系统管理现代化的重要内容之一。

负荷预测的和心问题是预测的技术方法,或者说是预测的数学模型,随着现代科学技术的快速发展,负荷预测技术的研究也在不断深化,各种各样的负荷预测方法不断涌现,从经典的单耗法。弹性系数法、共计分析法,到现在的灰色预测法、专家系统法、模糊数学法以及神经网络法、优先组合法和小波分析法,他们都有各自的研究特点和使用条件,不弄清其模型结构和使用范围而盲目地生搬硬套,可能不会取得理想的预测效果,反而事倍功半。

1 电力系统短期负荷

电力负荷预测中经常按时间期限进行分类,通常分为长期、中期、短期和超短期负荷预测[1]。通常长期负荷预测以年为单位,指10年以上的符合预测;中期负荷预测以年为单位,指5年左右的负荷预测。中长期负荷预测母的在于辅助决定新的发电机组的安装与电网规划、增容和改建。

电力短期负荷预测以月为单位的预测,指一年之内以负荷预测;同样可以以周、天、小时为单位的负荷预测,用来预测未来一个月度、一周、一天的负荷情况,并能够预测未来一天24h中每个时间段的负荷情况[2]。意义在于指导燃料供应的计划;提出运行中的电厂出力预告,提前估计发电机组的出力变化;有助于合理安排机组的启停和检修,在一定程度上提高了经济性,降低选择储备容量。

超短期负荷预测指未来1h、0.5h甚至10min的预测。其意义在于能够应用计算机在线控制电网、按预测发电量合理安排运行方式,进而降低发电成本。

2 基于灰色系统理论的模型的负荷预测方法

2.1 GM(l,l)模型建模机理

灰色模型(GREY MODEL,缩写GM)。灰色建模的思想是用原始数据序列作生成数后建立微分方程。由于系统被噪音污染后,所以原始数据序列呈现出离乱的情况,这种离乱的数列是一种灰色过程,对灰色过程建立模型,称为灰色模型[3]。灰色系统理论其所以能够建立微分方程型的模型,是基于下述概念、观点和方法。

(1)灰色理论将随机变量当作是一定范围内变化的灰色变量,将随机过程当作是在一定范围、一定时区内变化的灰色过程。

(2)灰色理论将无规律的原始数据经生成后,使其变为较有规律的生成数列再建模,所以GM模型实际上是生成数列模型。

(3)灰色理论按开集拓扑定义了数列的时间测度,进而定义了信息浓度,定义了灰导数与灰微分方程。

(4)灰色理论通过灰数的不同生成方式,数据的不同取舍以及参差的GM模型来调整、修正、提高精度。

(5)灰色理论模型基于关联度的概念及关联度收敛原理。

(6)灰色GM模型一般采用三种检验,即参差检验、关联度检验、后验差检验。参差检验是按点检验,关联度检验是建立的模型与指定函数之间近似性的检验,后验差检验是参差分布随机特性的检验。

(7)对于高阶系统建模,灰色理论是通过GM(1,N)模型解决的。

(8)GM模型所得数据必须经过逆生成作还原后才能使用。

2.2 GM(l,1)模型描述及建立

5 结论

1. 通过灰色模式GM(1,1)成功预测出黑龙江电网未来24h的电力负荷情况,并通过matlab绘制出其负荷曲线

2. 在电力系统灰色负荷预测中的应用结果表明,这一方法在提高灰色系统建模精度方面有相当的优越性,预测结果比常规灰色模型有很大的改善。

参考文献

[1] 赵希正.中国电力负荷特性分析与预测.中国电力出版社,2002.

[2] 陈志业,牛东晓,张英怀 等.电网短期负荷预测的研究.中国电机工程学报1995,15(l):30-35.

统计与预测论文例5

关键词:VAR模型;ECM模型;税收收入预测;协整分析

一、税收收入预测的意义

具体而言,我国税收收入预测的功能主要体现在三个方面:第一,事前预测,为税务部门制定年度税收计划提供数据支撑。此外,立足于地区经济发展的实际情况,增强预见性,帮助税务工作者根据经济变化实时调整相应的政策。第二,事中管理。税收计划执行过程中,每一个季度、年度都可以通过增值税收入预测模型实时追踪税收计划完成进度,衡量增值税目标完成情况,为后续税源管理、税收征管等工作提供帮助。第三,事后反馈。税收收入预测是基于经济因素对增值税收入的影响,但于此同时增值税作为地区经济体系的组成部分,反作用于其他经济变量。通过对增值税收入的预测结果与同期增值税收入的真实数值比较分析,不仅可以发现非经济因素变量对增值税收入的影响,不断完善税收收入预测模型,还可以制定相应的政策措施在影响增值税的同时调节整个地区的经济状况。综上所述,税收收入预测是一个十分值得研究的课题,不仅有现实层面的意义,而且利用统计建模的思想对经济变量进行分析预测具有一定的理论研究意义。

二、税收预测在国内的研究现状

我国关于税收收入预测的研究从80年代后期开始,前后共经历三个阶段,第一阶段主要是定性分析,以数据图表为基础,重点分析税收同经济变量之间的关联性,以理论研究为主,方法性不高;第二阶段的研究开始引入计量经济学的方法,比如趋势性预测,常见的有以GDP为自变量的一元线性回归和多经济指标多元回归等,另外,曲线回归模型和指数回归模型应用于税收收入预测的研究方法也开始涌现。第三阶段从90年代后期开始,主要是把时间序列分析的方法应用到税收预测当中去,这一阶段的文献大都涉及到统计模型在税收预测中实证研究,结果表明,模型的预测精度高,拟合效果好,因此这类模型在实际工作中应用的可能性也比较大,在下文中会对两个典型的时间序列预测模型进行比较详细的阐述。第四阶段是各类新型统计方法应用到税收预测当中,比较典型的是计算机模拟方法的应用,比如组合预测的方法、纳税评估仿生模型等。另外,统计软件的应用也越来越广泛,常见的有常见的有E-VIEWS、SPSS、SAS、STATA等,方便我们进行数据处理、模型的构建与求解等。下文将对时间序列分析中两个典型的税收预测模型进行重点介绍:

三、自向量回归模型(VAR)

简单来说,向量自回归模型(VAR)是以变量的历史数据为依托,分析变量间相关关系构造时间序列变量回归方程。

其中,代表被解释变量,是相关变量,分别表示被解释变量滞后各期的取值,和是待估系数矩阵,是误差向量,滞后期N通过AIC统计量法和SC准则来确定。可以看出,当期解释变量是全部相关变量滞后期取值的函数,回归方程的右边不含其它变量取值。VAR模型同传统的回归模型相比,其优势在于VAR模型只需确定变量间相互关系就可以得到回归方程,方程中只含有相互关联的变量,避免主观界定解释变量和被解释变量而导致部分变量的缺失。VAR模型的E-views软件操作包括四步:变量的平稳性和单位根检验;对相关变量进行协整检验,采用OLS法(最小二承法)构建回归方程,检验残差项平稳性来确定变量间是否存在稳定的协整关系;第三步是Grange因果检验进一步验证变量间的因果关系;最后在上述检验的基础上建立税收收入自向量回归预测模型。由于VAR模型本身不依赖于任何经济理论,仅仅通过回归方程带入相关变量的滞后期取值就可以得到预测值,所以VAR模型的拟合效果一般比较好,模型的预测精度较高。

四、误差矫正模型(ECM)

误差矫正模型的构建理论是误差矫正机制,它的原理在于,时间序列变量当期偏差会在以后各期得到校正,短期而言,由于随机干扰项的存在,变量间的协整关系会存在偏差,因而需要根据偏差的大小对变量加以调整,回归方程中的误差矫正系数就代表的短期向长期的调整。

ECM预测模型回归方程的形式为*+。其中,表示被解释变量,表示解释变量,表示待估系数,为误差矫正系数,为误差项。为了降低数据间的差异性,通常对时间序列变量取对数,针对对数序列进行单位根检验(E-views中可采用ADF检验法)和协整检验,得到回归方程后对残差序列进行稳定性检验以保证回归方程的效果。误差矫正模型和VAR模型最大的差异在于VAR模型只局限于变量间的相关关系,在短期预测得到的结果的准确度比较高,但是长期来说,考虑到干扰项的存在,用误差矫正模型进行预测得到的效果会更好,可以通过误差矫正系数调整短期向长期均衡靠拢。

五、结论及建议

从模型的角度来说,根据现有的有关税收与经济关系的经济理论可知,税源主要来自于经济生产和流通环节的各项产值,同GDP的统计口径有相互重叠的地方,当然,GDP规模要大于税收的计征数额,但是不可否认经济因素在税收计量因素中的重要地位。所以在税收预测模型的构建中通常采用GDP作为解释变量来预测税收收入的数值。所以,目前国内关于税收预测模型的文献中,无论是VAR模型,还是误差矫正模型(ECM),研究税收和GDP的居多,模型实证检验的结果显示,以GDP为自变量的回归方程对税收的拟合效果比较好,侧面反映了经济变量对税收的影响较大。同时,在对税收进行研究预测时,不能忽视经济以外因素的影响,例如,政策制度因素可通过界定税源、改变税率以及调整税制结构等直接或间接影响税收收入;社会环境因素偏重于一个地区的税收征纳环境,包括公民自觉纳税意识水平的高低,税务机关税收征管工作的好坏,以及征税纳税相关法律的完善等。(作者单位:东北石油大学)

参考文献

[1]尚红云.税收收入模型预测精度的比较.统计与决策,2008(3):40-43

[2]柳叶子.税收收入统计预测模型与税收数据检验[J].商化文化,2008(9)

[3]唐小我.最优组合预测的计算方法[J].管理现代化,1992(1):25—28.

[4]程毛林.我国税收增长的影响因素和预测分析[J],扬州大学税务学院学报,1998(2):18-21.

[5]郭江.论税收的弹性分析[J].财经问题研究,2001(11):58—59.

[6]漆莉莉.税收收入统计预测模型与经济分析[J].税务研究,2005(1):37-40.

[7]马永开,唐小我.两种组合预测优化模型的分析和比较[J].电子科技大学报,1998(2):99-103

[8]曹建新,李霞,李伟翔.广东国税税收收入弹性的实证研究[J].华南理工大学学报(社会科学版),2004(6):9-12.

[9]肖宏伟.基于分税种加总的税收收入推算预测[J].税收经济研究,2013(1):71-74

统计与预测论文例6

中图分类号:TM715 文献标识码:A 文章编号:1671-7597(2014)20-0175-01

1 负荷预测的目的和意义

电力系统的重要工作之一,就是负荷预测。其预测的准确与否对于电力市场的建立具有重要的意义,这主要表现在如下几个方面::1)准确的负荷预测是电力系统经济运行的主要依据。它可以使调度部门经济地安排、调整机组运行方式和电网购电计划等。2)准确的负荷预测是电力系统安全分析的基础。它可使安全分析得出的结论更接近真实,及时发现系统临界状态,确保电力系统运行的安全性和稳定性。3)准确的负荷预测是合理安排电网运行的基本要求。为了确保电网的可靠性运行,各种发电设备和供电设备都要在运行一段时间后检修,而准确的负荷预测可以使调度部门合理安排设备检修和机组的启停,以充分保证发电备用容量的充足和电网运行环境的可靠。通过上面的论述可知,对于电厂内部发电机组的经济合理的投入和停用,始终保持电网安全可靠地运行,降低不必要的并网容量,检修计划的合理安排,发电成本的降低,经济效益的提高和社会的稳步发展,电力负荷的准确预测都是至关重要的。

2 国内外对于电力负荷研究的现状

电力负荷的预测是近几十年发展起来的科学预测技术,这种负荷预测的技术在国外开始研究的较早。并且在实际的工作当中,将这种技术逐步的应用。通过漫长的认识过程,我国才开始重视负荷预测。在新的市场体制下,电力网高速的发展推动下,迫使负荷预测被提到了一个新的高度。多年以来,无论是国内学术界,还是国外学术界,都对电力系统的负荷预测进行了大量而充分的研究。截止到目前,已经有上百种方法被提出用于负荷预测。但是,大多数还处于研究阶段,并未得到实际的应用。

从20世纪六、七十年代开始至今,对于负荷预测,大体上可以分成两个阶段:第一个阶段,这一个阶段,还在沿用传统的方法进行负荷预测。也就是,在这个阶段,沿用了在经济领域使用的预测技术。对于负荷序列本身的规律的研究,是这一阶段研究的重点。通过对负荷的历史状况与其他相关因素之间的关系,完善并建立了统计模型。在第一阶段中,使用的预测方法主要有以下几种:回归分析法、时间序列法、趋势外推法。第二个阶段,在这个阶段,一些智能化的预测手段被提出,如:通过建立专家系统模型,人工神经网络模型等,对负荷进行预测。与此同时,灰色系统理论、非线性系统理论、小波分析理论等技术方法被提出。

3 灰色系统的基本理论

使用电力负荷的历史数值和现在数值,来预测出未来数值,是负荷预测的一大特点。因此,研究人员需要通过科学合理的预测手段,才能对所研究的随机不确定事件做出准确地分析预测,进而获得负荷的未来发展趋势及可能出现的状况。但是,对于电力负荷的未来,其发展又是不确定的,一定会受到来自各个方面的影响,例如:人类的生产活动,复杂多变的气候等等。并且,来自各个方面的影响又不是确定不变的,是在时刻变化发展的,无形当中又增加了预测的难度。对于复杂多变的外部影响,有些是人们根据经验可以预先判断的,而有些是无法预见到的,再有一些临时的突况,就会直接影响到预测的准确性。作为一门新兴的科学预测手段,灰色理论是通过对不完全确知的信息进行研究,通过对现在已经掌握的部分信息进行提取,整理,生成有价值的信息,从而形成对未来发展的有效控制。介于黑色系统和白色系统之间的系统,既是灰色系统。而信息不完全的系统是,对于信息只是掌握了一部分的系统。严格意义上来说,相对于黑色系统与白色系统,灰色系统是绝对的。相应的,我们可以使用“黑”和“白”来分别表示信息的未知和信息的完全明确,使用“灰”来表示一部分信息已知,一部分信息未知。所以,可以对于信息不知的系统定义为黑色系统,对于信息已知的系统定义为白色系统,一部分信息已知、一部分未知的系统定义为灰色系统。由此可知,灰色系统的一大特征就是信息的不完全性。灰色系统理论又与数据统计有根本上的区别,前者是对于未来科学规律的研讨,而后者是对于历史规律的研讨。灰色系统理论又与模糊数学存在本质区别,在于对内涵和外延处理的方式不同。前者体现在着重外延的明确性,后者体现在着重内涵的明确性上。从分析的手段上来看,灰色系统又与传统的方法一致,即整体化、优化、模型化原则。灰色系统分析法较比传统的数理统计又存在几大优点:对于不确定量,使之量化,利用灰色数学来处理不确定量,使之量化,进而知道事物在任何时刻的运动规律;不是把对数据的观测过程作为研究手段,而是通过累加或者累减来使变化的灰色量逐渐白化作为预测手段。从以上所介绍的负荷预测理论相关知识可以看出,不确定因素始终贯穿于整个灰色预测的全过程,同时也受到来自外界的不断变化的诸多因素的影响。据此,由于误差的存在,无论使用哪一种预测的方法,都直接影响到预测的准确性,误差小,能够达到高准确性,误差大,就会降低准确性。

4 灰色预测在短期和中长期负荷预测中的意义

作为电力部门,负荷预测是一项常规的日常工作。无论对于用户来说,还是对于电力企业本身来说,预测结果的准确与否,都直接关系到用户或者企业的利益。正确的预测电力负荷,既能保证为人民日常生活提供充足的电力,也为全国电力规划的编制提供了充分的依据。综上,准确的电力负荷预测,既能保证工业的正常运作,又能促进国民经济的快速发展。

5 结论

目前,负荷预测从开始的研究提出,到现在的广泛应用,至今仍在发展。至今,从负荷预测的方法、负荷预测的技术,以及分析思路上都在继续不断创新。同时,也是指导我们进行负荷预测研究的指南针。

统计与预测论文例7

1灰色马尔可夫系统理论

灰色系统是部分信息不充分、不完全的系统,灰色系统理论即在部分已知数据的基础上,通过开发、分析获取有价值的信息,以完成对系统行为的控制以及优化。马尔可夫预测理论则相对适用于数据序列随机波动性较大的问题,考虑道路交通事故预测其呈现非平稳随机变化过程,因而可以利用马尔可夫理论进行事故的预测,且可以将灰色系统理论以及马尔可夫理论相结合来进一步提升模型的预测可靠性:灰色系统理论可对道路交通安全时序变化趋势进行预测,而马尔可夫理论则可用于转移概率的确定。马尔可夫理论对于随机的动态系统的评估依据是系统状态间的转移矩阵,通过转移概率反映的状态间的转换规律来对系统发展进行评估预测。

马尔可夫随机过程理论将系统将来所处的状态归根于系统现在所处状态:假设对于随机过程M(t),过程中t0时刻状态已知,则系统后续过程的状态均只与t0时刻状态有关,因此马尔可夫理论具有较强的无后效性。

马尔可夫理论中,状态转移概率指的是系统的发展过程中,从某一状态至另一状态转变的可能性。若在系统发展过程中可出现n个可能状态,记作M1、M2、M3、…、Mn,则系统状态转移概率即指系统从任一状态Mi出发转移至下一状态Mj的概率,记作Pij,若经k步转移至Mj,则其转移概率可记作Pij(k),此时与初始时刻无关,对于状态转移概率矩阵的计算通常采用频率近似概率的思想进行。

灰色马尔可夫预测模型结合了灰色理论以及马尔可夫理论的各自优势,做到优势互补,能够提升对于过程分析的预测精度。其模型预测流程图如下图1所示,模型的基本思想:首先基于GM(1, 1)模型算得原始序列M合值及残差(相对值),然后对于得到的残差序列进行状态划分,计算状态转移概率,得到残差相对值序列中分别对应的状态,并在此基础上,建立灰色马尔可夫预测模型进行预测。

图1 灰色马尔可夫预测模型流程图

2道路交通事故灰色马尔可夫预测模型

2.1建立道路交通事故GM(1, 1)模型

考虑到交通事故发生的随机性以及不确定性,因此交通事故各项数据也具有极强的随机性,可采用累加或累减的统计方法进行初始数据的处理,寻找其数据内部规律。假设t序列的交通数据原始序列为x(0),则{x(0)(k)}=

{x(0)(1)、x(0)(2)、…x(0)(n)},对于原始数据序列进行累加统计处理,可得到如下数据序列:

然后在处理数据的基础上,进行建模计算:首先建立灰色预测模型的微分方程

微分方程中系数a、b依据最小二乘法确定。对于上述微分方程进行求解,可获得相应系数,对其还原处理,得到:

文章对于近10年间我国道路交通事故10万人口死亡率作为分析研究对象,在获取原始数据序列的基础上,通过最小二乘算法计算道路交通事故GM(1, 1)模型中的a及b,算得a=-0.04,b=3.89,将数据分别代入上式,计算得:

2.2状态划分

状态划分需依据实际系统进行数据序列的合理划分,传统分析方法如均值―均方差分级法等对于数据序列的数据量要求较大,目前应用的方法包括样本均方差法以及聚类分析法,这两种方法较符合统计建模特性。在实际应用过程中,对于分析数据较少的情况可采用离差平方和法,对其类间评价分析可利用欧式平方距离的方式,相较于传统分析方法更为可靠、高效。

根据本实例所选取的研究对象:近10年间我国道路交通事故10万人口死亡率,采用层次聚类法进行状态划分,划分依据为实际量与拟合量的相对百分比值,得到的划分结果如下表(见表1)所示:

表1 道路交通事故10万人口死亡率状态划分表

状态编号 M1 M2 M3

实际量与拟合量的相对百分比值 0.89―0.97 0.97―1.06 1.06―1.15

2.3状态转移概率计算

在状态划分的基础上,计算状态转移概率矩阵:

2.4道路交通事故灰色马尔可夫预测

依据所得状态转移矩阵,即可进行道路交通事故的预测,同样以道路交通事故死亡人数为例,对于道路交通事故的灰色马尔可夫预测模型的预测精度进行检测。依据我国道路交通事故所致死亡人数的逐年统计表,对于未来几年的道路交通事故所造成的死亡人数进行预测,首先需依据状态划分确定待预测的时间处于何种状态,并依据状态转移概率的确定方法,对于状态转移概率矩阵进行分析研究,在确定好转移时长的基础上,可预测特定时间内的道路交通事故导致的死亡人数。通过对比发现,灰色马尔可夫模型对于道路交通事故预测的精度以及可靠性均优于GM模型。

3结论与展望

灰色模型以及马尔可夫模型均有其各自的特点,实际应用过程中均有其局限性。本文在对道路交通事故发生的预测过程中,将二者有机地结合起来,做到优势互补,使得优化后的分析数学模型更符合客观实际,并且实际预测应用中也发现,灰色马尔可夫模型的应用可体现预测对象的实际波动特性;

统计与预测论文例8

一、引言

在对股票非预期收益的研究中,最早起始于Ball和Brown(1968)的研究,将股票非预期收益与公司非预期会计收益进行回归,用来检验会计收益的价值相关性。Chambers和Freeman(2005)提出了反映与非预期会计收益相关的风险度量模型。本文基于宿成建(2012a,b)提出的股票非预期收益定价模型框架来检验总风险、系统风险对会计收益反映系数及分析师盈余预测修正系数的风险效应。

二、实证检验

(一)会计收益反映系数的风险效应

在分析风险与ERC的关系中,模型的设置尤为重要。根据前面的理论和实证分析发现,宿成建(2012a,b)提出的三因素模型是一个可以精确解释股票非预期收益的正确模型,那么,是否可以参考Chambers等(2005)的框架,将总风险加入到因素模型中,来考察总风险对ERC的影响呢?也就是通过如下模型,来考察γ1+δ1总风险对ERC的影响,或者说高风险公司具有高的δ1值。即有如下回归方程:

由于γ1+δ1包含了ERC(γ1)和总风险(δ1)的总效应,用以上模型来刻画总风险对ERC的影响不能直接看出总风险对ERC的关系,并且,总风险还不能作为独立变量来解释股票非预期收益。表1所报告的结果显示,总风险变量为内生变量,因此将总风险变量作为控制变量加入多元回归方程来研究总风险与ERC的关系所得出的结论将不具备稳健性。此外,根据前文分析,由于TRUE和SRUE分别是非预期会计收益(UE)与总风险和系统风险的乘积,因而,UE与SRUE与TRUE就存在无法避免的多重共线性问题。本文采用宿成建(2012)提出的股票非预期收益定价模型框架来检验会计收益反应系数、分析师盈余预测修/正系数的风险效应。通过以上的分析,将检验如下假设:

假设1:ERC随着总风险增加而增加;假设2:高总风险公司对证券分析师预期的会计收益增长信息存在风险补偿效应;假设3:ERC随着系统风险增加而减少;假设4:高系统风险公司对证券分析师预期的会计收益增长信息存在风险补偿效应。

表2报告了使用标准Fama和French(1973)方法得出的时间序列横截面回归模型估计系数。PanelA和PanelB分别报告了市场风险溢价在3%和5%条件下的股票非预期收益的回归模型估计结果。被解释变量的样本区间是从2004年4月至2011年3月,作为解释变量的贝塔则起始于2002年1月。表6 PanelA所示,高总风险组合股票的ERC是2.217,T值8.154;低总风险组合的ERC是1.285,T值5.259。因此,高风险组合股票的ERC与低风险组合的ERC之差是0.932,说明股票高总风险越高具有更高的ERC,假设1得到验证。这个结果与Chambers等(2005)的预测一致。然而,无论是高风险组合股票还是低风险组合,反映证券分析师预期的会计收益增长信息的分析师盈余预测修正变量的估计系数却没有显著差异,说明股票价格对证券分析师预期的会计收益增长信息不存在总风险补偿效应。因而,假设2没有得到验证。

表2Panel B所示,高系统风险组合股票的ERC和REERC估计系数均分别显著大于低系统风险组合股票的ERC和REERC的估计系数,并且估计系数是经济意义和统计意义上是显著的,说明ERC随着系统风险增加而增加,并且,对于高系统风险公司,证券价格对证券分析师预期的会计收益增长信息存在系统风险补偿效应。假设3和假设4得到验证。假设3的结果与Cready,Hurtt,和Seida(2000)的预测一致,与Collins和Kothari(1989,p167)报告的ERC与贝塔呈负相关则相反。本模型的预测与现有金融理论相吻合,即高风险需要高收益进行补偿,意味着相对高的ERC(或REERC)反映系数效应。

三、结论

本文检验了总风险、系统风险对会计收益反映系数及分析师盈余预测修正系数的风险效应并发现:第一具有高总风险的股票具有更高的ERC;第二股票价格对证券分析师预期的会计收益增长信息不存在总风险补偿效应;第三ERC随着系统风险增加而增加,并且,对于高系统风险公司,证券价格对证券分析师预期的会计收益增长信息存在系统风险补偿效应。

参考文献

[1]宿成建.2012a:《非预期股票收益理论与实证研究―基于中国股票市场的检验》,2012CICF中国金融国际年会论文,《投资研究》,2014,33(7):126-143.

统计与预测论文例9

我国煤炭资源开采矿井多属井工矿井,且井下地质条件复杂,在煤矿生产过程中频遇水、火、瓦斯、粉尘等灾害因素的影响和威胁。随着开采煤层的逐步加深和强度的逐步加大,开采条件越来越复杂,煤岩动力灾害如煤与瓦斯突出等问题凸显,安全形势日益加重,因此加强煤与瓦斯突出预测研究工作对确保煤矿安全生产有很高的重要性和必要性[1]。然而在煤与瓦斯突出预测过程中,整理和分析大量数据和指标任务繁重,且需要构建预测模型算法进行数据分析计算,无形中增加的预测工作的繁重性和出错率。

1 系统总体设计与各部分功能设计

本预警系统总体思路为对煤与瓦斯突出机理进行理论分析,选取影响煤与瓦斯突出的主要因素,并现场测量大量的数据指标,通过建立灰色关联模型算法对影响煤与瓦斯突出的主要指标的影响程度进行排序后,构建模糊聚类预测模型算法,运用现场数据进行学习训练,得出预测结果。

该系统的主要功能模块包括预测指标管理、样本管理、突出预警、用户管理以及综合查询等五个方面,预测指标管理主要实现煤与瓦斯突出预测指标的录入、查询、删除、修改等功能;样本管理模块主要实现数据样本的录入、查询、删除、修改等功能,并可实现大量数据的EXCEL导入以及表格预览功能;突出预警模块根据用户输入的突出预测指标和样本数据进行分析计算,进行煤与瓦斯突出预测,并根据预测结果给出专家建议,专家建议根据突出预测的不同数据对应给出相应的处理措施;用户管理模块包括用户基本信息注册、用户名及密码的注册及修改、用户权限管理等。综合查询对预测指标、数据样本、突出预测记录以及用户信息、用户权限等进行综合全面查询。

2 系统算法模型构建

2.1 基于灰关联的预测指标优选

经理论研究并结合煤矿现场实际经验得出以下规律:第一,突出危险性与煤层埋深、煤层厚度有一定关系,煤层埋藏越突出深危险性越大,煤层厚度越厚突出深危险性越大。第二,瓦斯压力越大突出危险性越大。第三,地质构造越复杂,突出危险性越大。第四,煤的坚固性系数越低,突出危险性越大[2]。结合以上规律,从所有的影响因素中选定构造类型、瓦斯压力、瓦斯放散系数、煤的坚固性系数、综合指标K五个较为重要的影响指标进行计算预测。

以某煤矿的现场情况以及实测数据为数据基础,使用灰色关联预测算法对以上指标进行危险性影响程度排序,上述5项指标中,煤的坚固性系数f值越小,突出危险性越大,成反比关系,因此将煤的F值指标序列求倒数化像。求初值像、两极差并运用计算关联系数运用(i=1,2,3,…,6)计算各项指标关联度,得出各项预测指标关联度。得出瓦斯压力0.9631、瓦斯放散系数0.9162、煤的坚固性系数0.9808、构造类型0.9840、综合指标D0.8231,根据各项指标的关联度进行排列。

2.2 模糊聚类法构建突出预测模型

根据灰色关联度分析,选定影响性较大的煤的坚固性系数、瓦斯压力、构造类型、瓦斯放散系数、综合指标D四个指标作为预测因素构建模糊聚类算法,设论域U={x1,x2,……,x10}为样本集,每个样本包括煤的坚固性系数、瓦斯压力、构造类型、瓦斯放散系数、综合指标D四个样本特征,并运用极差变换法,对数据进行标准化处理,变换之后的数据为大于等于0小于等于1的小数[3]。运用绝对值指数法公式:把地质构造指标权重加大之后的绝对值指数法的公式[4]可表示为:。计算出相似矩阵之后运用平方法计算传递闭包。通过等价矩阵可计算出聚类结果[5]。

3 系统开发

3.1 系统的设计目标

通过系统录入煤与瓦斯突出预测指标的已知样本和预测样本,系统采用灰色关联分析程序进行指标优选,并通过模糊聚类程序进行突出预测。

3.2 系统架构确定

C/S模式客户端能处理部分事务,分担服务器任务量,使系统具有高效的处理速度,且煤与瓦斯突出预警系统主要为煤矿工作人员使用,使用地点较为固定和集中,不会因为距离远而造成任何的麻烦。所以为使用系统简单高效、易维护 [6]。

4 结论

本文设计的煤与瓦斯突出预测软件主要通过灰关联指标优选算法和模糊聚类预测算法实现,将两种算法有效结合使用,将大大增加预测的准确性。软件由用户登录及主界面模块、样本管理模块、煤与瓦斯突出预测模块、查询模块、用户管理模块和系统说明模块组成,充分体现出人性化和个性化设计原则,在指标录入模块、样本录入模块、样本修改模块、指标优选模块、模糊聚类模块和指标设置模块等都给用户提供不少人性化和个性化功能,让用户可以自由选择数据、样本、指标的录入方式,将常用的预测指标名称加入数据库中,录入数据后系统自动进行分析计算并给出预测结果,无须每次手工大量录入和复杂计算,极大减轻了突出预测的工作量。

参考文献:

[1]周世宁,林伯泉.煤层瓦斯赋存与流动理论[M].北京:煤炭工业出版社,1999:69-71.

[2]国家安全生产监督管理总局.防治煤与瓦斯突出规定[S].北京:煤炭工业出版社,2009.

[3]何学秋.含瓦斯煤岩流变动力学[M].徐州:中国矿业大学出版社,1995:14-16.

[4]王凯,愈启香.煤与瓦斯突出的非线性特征及预测模型[M].徐州:中国矿业大学出版社,2005:111-113.

统计与预测论文例10

中图分类号:F83 文献标识码:A

收录日期:2013年1月2日

一、文献综述

学术界一直十分关注股票收益率可预测性的研究,但对于股票价格能否被预测还没有达成共识(Goyal和Welch,2007;Campbell和Thompson,2008)。在早期研究中,学者们常常关注股价本身及交易量对股价的预测能力,后来这种局限逐渐被打破。1934年,Graham和Dodd提出了高价值比率(valuation ratio)的概念;Sharpe(1964)、Lintner(1965)和Black(1972)提出了经典的CAPM模型,试图用市场风险解释资产的期望收益率的变化。上世纪八十年代以后,其他解释变量也陆续被找到,如股息率、股息支付率、市盈率等。另外,学者们也发现了许多宏观变量对股票超额收益率的预测能力。Campbell(1987)、Fama和French(1989)发现了股票收益率与短期、长期的国债利率的相关关系;Ramin和Tiong(2000)通过对新加坡股票市场的研究,发现利率和汇率对股票收益率具有显著的影响;David(2001)利用三个月国债利率、十二个月国债利率、失业率、工业生产指数、消费者物价指数等对S&P500的月收益率进行研究,发现十二个月国债利率和失业率具有显著的预测能力;David、Mark和Jesper(2005)考察了九个宏观变量对十二个国家的股票收益率的预测能力,结果发现利率的预测能力最可靠。

我国学术界关于股票收益预测性的研究早期围绕着股票市场假说和随机漫步理论(俞乔,1994;宋颂兴等,1995;吴世农,1995),后期一些学者重点研究了CAPM模型以及FF三因子模型,如杨朝军等(1998)、陈小悦等(2000)、杨炘等(2003)。在研究宏观变量与股票收益率的相关性方面,刘金泉等(2004)、肖才林(2006)等认为我国股票收益率与通货膨胀率之间存在负相关关系;韩学红等(2008)详细的论述了通货膨胀率和股票收益率的相关性,认为二者的关系从经济学理论上来说是不确定的,实证检测中在不同的样本区间二者之间的相关性正负也不同;郭田勇(2006)分析研究了股价波动对货币政策的影响;孙华妤和马跃(2003)利用VAR模型分析了股价与GDP、CPI之间的关系,发现货币供应量对股市的作用不大;晏艳阳等(2004)研究了股票价格与债券、出口、国内信贷即短期利率之间的长期协整关系;孙洪庆等(2009)检验了中国股票价格与GDP、工业生产值、个人消费支出、国内固定资产投资、CPI以及货币供应量的协整关系,发现中国股票价格是反经济周期的,但是股票价格与货币供应量之间有相对较强的协整关系。

传统的研究预测方法主要依赖于样本内的回归模型中相关系数的t检验和R2值,然而这种方法本身具有小样本偏误问题和数据重叠问题,会导致虚假的回归结果。近年来,多数学者倾向认为样本外股票报酬预测能力的证据比样本内的证据更可靠,因此纷纷利用样本外(out-of-sample)检验方法来检验预测能力。姜富伟等(2011)采用了这一方法,并对12个经济变量的股票收益预测能力进行了检验,发现样本外检验中所有的行业投资组合都具有很强的可预测性,但是不同成分投资组合的可预测性存在显著差异。

本文遵循国际上的惯例,从样本内和样本外来共同检验中国股票市场超额回报率的可预测性;选择的宏观变量也是研究领域被广泛认可与股票收益率密切相关的,包括消费者价格指数(CPI)、工业生产物价指数(PPI)和先行指数(LI)。参考Campbell和Tompson(2008),本文采用的两个统计指标分别为累计预测误差平方差曲线(cumulative squared prediction error,CSPE)和样本外R2,同时也根据统计指标R2对投资组合的构建提出了一定的意见。本文接下来的结构为:第二部分介绍数据的来源以及各种变量的构成;第三部分主要围绕样本内外检验,并对统计指标R2的投资学意义进行了详细的探讨;第四部分是结论。

二、数据来源与构建

根据数据的可获得性,本文样本覆盖的时间段是2001.1~2012.10。在将数据进行简单处理之后,有效的样本空间为2001.2~2012.8。被解释变量为股票超额收益率,即股票市场回报率与同期的短期无风险利率之差。

股票收益率:本文从Wind数据库获取了两种指数的月度数据——上证综指和深证成指,据此计算出月收益率,然后将无风险利率从月收益率中剔除。

无风险利率:本文采用银行间隔夜拆借利率作为无风险利率的替代变量,数据来自中经网数据库。

在解释变量方面,本文选取了消费者价格指数、工业生产物价指数、先行指数等三个宏观变量。原始数据均来自中经网数据库,后经过简单计算获得这三个变量的月度变化数据。根据目前文献的研究结果,消费者物价指数与股票收益率的关系不确定(韩学红等,2008),所以本文的目的是利用新的研究样本和计量方法对二者的关系进一步检验;工业生产指数和先行指标都反映了整体经济情况,因而应与股票超额收益率呈正相关关系,所以本文也预期这两个解释变量的相关系数为正。表1显示的是股票超额收益率、消费者价格指数、工业生产物价指数、先行指数的统计特征值。(表1)

三、实证检验

(一)全样本检验。本文采用简单线性回归模型:

yt+1=?琢+?茁·xt+ut+1 (1)

其中,yt+1是股票在t+1时刻的超额收益率,xt是某一被认为具有预测能力的宏观经济变量,ut+1是残差。

xt的预测能力由对应的■的t值和R2值决定。零假设是?茁=0,即宏观经济变量没有预测能力,超额收益期望是常数;消费者物价指数的备择假设为?茁≠0,工业生产物价指数和现行指数采用单边假设?茁>0。检验结果如表2所示。(表2)

由表2的结果可以看出,在全样本范围内,深圳成指和上证综指的超额回报率均与消费者价格指数和工业生产物价指数均呈负相关关系,但是相关系数并不显著;深圳成指和上证综指的超额回报率均与先行指标具有显著的正相关关系,与预期相符。

(二)样本内估计。本部分和下一部分将检验各个宏观经济变量对股票超额收益率的样本内和样本外的预测能力。首先将整个样本分为样本内和样本外两部分如图1所示,样本内覆盖前60个数据(2001.2~2006.1),用来估计宏观经济变量和股票市场超额回报率的相关系数;样本外覆盖剩下的79个数据(2006.2~2012.8),用来评价宏观经济变量对股票市场超额收益率的预测能力。然后,在保持全样本不变的情况下,将样本内的数据向前推进一期、样本外数据减少一期,即样本内覆盖前61个数据(2001.2~2006.2),样本外包括之后的78个数据(2006.3~2012.8)。同样,样本内的数据用来估计解释变量的相关系数,而样本外的数据用来评价该解释变量的预测能力。以此类推,如图1所示。(图1)

(三)样本外预测。如上一部分所述,本文利用滚动法(rolling)预测股票超额回报率。根据公式■■=■■+■■x■(其中的相关系数■■和■■均来自样本内的估计结果),可以得到股票超额回报率的预测值■■,从而计算出预测误差■■=y■-■■。另外计算样本内时间段的股票超额收益率的历史平均值■■,从而计算出预测误差■■=y■-■■,那么,■■、■■的初始值分别是■■、■■。注意历史平均值■■表示的是如果宏观经济变量不具有解释或预测能力时未来股票超额收益率的估计值,所以如果■■大于■■,则表明历史平均值的估计优于利用宏观经济变量的估计,即说明宏观经济变量不具备解释或预测股票超额收益率的能力。

获得了■■和■■的数据序列之后,本文计算了两个常用的统计值来检验各个宏观经济变量的样本外预测能力。一个是累计预测误差平方差曲线(cumulative squared prediction error,CSPE):

CSPE■=∑■■■■■-∑■■■■■ (2)

随着时间的变化,CSPE曲线可以上升,也可以下降。CSPE曲线的上升意味着宏观经济变量预测能力的提高;如果CSPE曲线一直在x轴上方,则对应的宏观经济变量具有很强的预测能力。从图2可以看出,对于上证综指,消费者价格指数和先行指数在2008年中期以后都一直具有正的CSPE值,而且先行指数的CSPE曲线趋势是不断上升的,所以消费者价格指数和先行指标都具有很强的预测能力;对于深证成指,消费者价格指数不能一直保持在x轴上方,而工业生产物价指数和先行指数分别在2009年初和2008年中期以后都相应的具有正的CSPE,而且先行指数的CSPE曲线趋势不断上升,所以工业生产物价指数和先行指数对深圳成指具备很强的预测能力。(图2)

另一个统计检验值是仿照传统的(样本内)R■构建样本外R■■:

R■■=1-■ (3)

如果R■■是正的,则通过宏观经济变量来预测的股票超额回报率的预测误差小于仅根据历史平均超额收益得到的预测值的预测误差,说明宏观经济变量具备解释或预测股票超额收益率的能力。从表3可以看出,对于深圳成指来说,只有先行指数的R■■为正,说明只有先行指标对其具有预测能力;对于上证综指,消费者价格指数和先行指标的R■■均为正,意味着消费者价格指数和先行指标都对其具有预测能力。

对比两个统计指标的结果,消费者价格指数和先行指数对于深圳成指和上证综指的预测能力的结果是一致的:x轴上方的CSPE曲线对应了正的R■■,如果CSPE曲线不能保持在x轴上方,对应的R■■也为负。但是工业生产物价指数虽然在2009年之后保持了正的CSPE,R■■却为负,这说明工业生产物价指数综合的样本外预测能力不强。(表3)

(四)对R2的讨论。从本文的表2和表3都可以发现R2统计值非常小,Campbell和Tompson(2008)也发现了类似的结果。从统计学角度来看,这样小的R2值是没有意义的,但是从经济学角度可以发现这些很小的R2对投资组合的选择依然具有很大的指导价值。

根据Campbell和Tompson(2008)的推导可知,如果投资者没有利用某个宏观经济变量(如xt)预测,那么他选择的投资组合的超额回报率的期望就是:

■■■ (4)

其中,?酌是投资者的风险厌恶相对系数(coefficient of relative risk aversion),?滋是历史平均收益率,?滓■■和?滓■■分别是宏观经济变量和某一随机变量(random shock,?着)的方差,S是夏普比率(Sharpe ratio)。

如果投资者利用该宏观经济变量预测,则他选择的投资组合的超额回报率的期望就是:

■■■■ (5)

注意等式左边的分母是?滓■■而不再是?滓■■+?滓■■,这是因为投资者现在利用宏观经济变量做预测了,所以宏观经济变量的变动不会再对整个投资组合的风险产生影响。

这两个超额回报率的期望的差是■■1+S■,所以通过利用宏观变量来预测使得超额回报率提高的比例是■■,这个值永远大于R■/S■,并当投资时间跨度很小而且R■和S■都很小的时候接近于R■/S■。这个结果说明,当评价R■的大小时,应当将R■与夏普比率方S■进行比较。如果R■大于S■,那么投资者就可以利用宏观经济变量的信息使得投资组合的超额回报率提高。

从Wind数据库可以得到2006.2~2012.8期间,上证综指的S■的均值是6.55%,深圳成指的S■的均值是0.047%。将表3的数据和S■进行比较可知,先行指数对于深圳成指R■均大于对应的S■,但是消费者价格指数和工业生产物价指数的R■均小于S■。这说明只有通过先行指数进行的预测对于投资组合的超额回报率的提高有显著的影响。

四、结论

本文研究了消费者价格指数、工业生产物价指数和先行指数等宏观经济变量对股票超额收益率的预测能力。尽管目前对我国物价水平(通货膨胀率)与股票收益率的相关关系的研究并没有什么定论,但是本文的结果显示从2001年2月至2012年8月期间,消费者价格指数与下一期的股票超额收益率呈负相关关系,即物价水平越高,下一期的股票收益率越低,这个结果和多数研究的结论保持一致。股票超额收益率随着上一期的先行指数的增减而增减,这符合预期和经济学理论。工业生产物价指数与股票超额收益率的相关系数为负,与之前的预期矛盾,但这个结果似乎符合我国实体经济与股票市场常常“背道而驰”的现状,这一结果和现状值得在以后的研究中进一步讨论。

为了获得更可靠的结果,根据现存许多国内外文献的研究办法,本文从样本内和样本外同时检验了股票市场超额回报率的可预测性,样本外统计值利用的是累计预测误差平方差曲线(CSPE)和样本外R2。结果显示先行指数对于上证综指和深圳成指都具有很强的预测能力,消费者价格指数仅对上证综指具有预测能力,而工业生产物价指数对两个股票市场指数都不具备长期稳定的预测能力。这一结果与全样本回归的结果并不矛盾,即先行指数的预测能力很强,消费者价格指数的预测性稍差,但是工业生产物价指数却并没有如预期的那样能够预测下一期的股票超额回报率。另外,通过对样本外的深入研究可以发现,利用先行指标进行投资理论上可以很好地提高股票超额收益率。

主要参考文献:

[1]周爱民.股市可预测性与技术指标协整性的模型检验[J].数理统计与管理,1999.19.

[2]李锐,向书坚.非平稳条件下的市场可预测性问题研究[J].数量经济技术经济研究,2008.9.

[3]杨炘,陈展辉.中国股市三因子资产定价模型实证研究[J].数量经济技术经济研究,2003.12.

[4]陈小悦,孙爱军.CAPM在中国股市的有效性研究[J].北京大学学报,2000.4.

[5]韩学红,郑妍妍,伍超明.对我国股票收益率与通货膨胀率关系的解释:1992-2007[J].金融研究,2008.4.

[6]郭田勇.资产价格、通货膨胀与中国货币政策体系的完善[J].金融研究,2006.10.

[7]孙华妤,马跃.中国货币政策与股票市场的关系探索[J].经济研究,2003.7.

[8]晏艳阳,李志,许均平.中国股市波动与宏观经济因素波动间的协整关系研究[J].统计研究,2004.4.

[9]孙洪庆,邓瑛.股票价格、宏观经济变量与货币政策——对中国金融市场的协整分析[J].经济评论,2009.4.

统计与预测论文例11

一、引言

消费是拉动经济增长的“三驾马车”之一,而在内蒙古地区,进出口贸易比重不是很大,主要依靠投资和消费拉动经济增长,在这种情况下对消费的研究就显得十分重要了。同时,消费也是经济增长对人们生活质量改善情况的一个重要体现。因此,对消费支出的预测对于制定各种相关经济政策更是有着十分重要的意义。

二、相关模型和理论的介绍

(一)灰色系统理论

灰色系统理论是中国学者邓聚龙教授1982年3月在国际上首先提出来的。他在研究概率统计和时序分析方法时,发现概率统计追究大样本,先知分布规律,发展趋势;而时间序列则只致力于数据的拟合,不注重规律的发现。于是他选择用少量的数据进行微分方程建模的研究。其中多数列的微分模型揭示了系统各因素间的动态关联性,是建立系统综合动态模型的基本方法。邓聚龙教授以单数列微分方程GM(1,1)为基础,得到了各类灰色预测方法,将GM(1,1)运用到局势决策与经典的运筹学规划中,建立了灰色决策,通过建立的关联度、关联空间等,形成了以系统分析、信息处理、建模、预测、决策、控制为主要内容的灰色系统理论。而GM模型也就是灰色模型,一般通过使用数据序列建立差分方程来建立模型,灰色建模时用历史数据生成后建立的微分方程模型。

灰色组合模型则是将灰色系统模型或灰色信息处理技术与传统模型结合后得到的有机组合体。其中如果能直接分解出灰色系统模型,则称组合体为显性灰色组合模型;反之,则称为隐形灰色组合模型。本文中用到的灰色经济计量学模型以及灰色马尔可夫模型都属于后者。

三、模型的建立

为了进一步的体现影响居民消费支出的因素,本文选取了凯恩斯的消费函数作为研究消费支出的模型,在此基础之上,采用灰色计量模型的方法对消费支出进行研究。

本文选取了2000-2005年6年间的数据来对消费支出进行分析。其中,令城镇居民可支配收入为X,其具体数值为(5129,5536,6051,7013,8123,9137);城镇居民消费支出为Y,其具体数值为(3928,4196,4860,5419,6219,6929)。为了削弱实际值的随机波动效果,分别对X和Y建立GM(1,1)模型,其时间响应函数如下:

其中,参数a=-0.130567,b=4403.423208,b/a=-33725.294048,而模型的平均相对误差为1.160016%,其模拟值为(5129,5419.175,6175.01,7036.265,8017.643,9135.899)

模型参数为a=-0.123623,b=3500.337494,b/a=-28314.646007,平均相对误差为0.825716%,模拟值为(3928,4242.783,4801.088,5432.859,6147.764,6956.744)

根据GM(1,1)模型估计出的模拟值,使用EVIEWS6.0建立消费函数模型,其建模结果如下:

根据上表可知,拟合模型为: Y=170.3423+0.74517X,其中,X的t检验值为61.88584,而方程的R2=0.998957,调整后的R2=0.998696,F检验值为3829.857,D.W=1.526583。从上述检验结果可以看出,方程的拟合效果很好,能够很好地用居民可支配收入来解释消费支出的变化情况。现将消费支出的拟合值与其实际值进行对比,结果如下:

模型的平均相对误差为0.95897%,可以说误差相对较小,从另一个方面也说明了模型的拟合效果是非常好的。

四、预测

为了检验模型的预测效果,现通过GM(1,1)对2006-2008年的个人可支配收入进行预测,并将其带入到所求的消费函数模型,求出对内蒙古城镇居民的消费支出的预测值,其结果如下:

通过检验结果可以看出通过灰色计量模型对内蒙古城镇居民的消费支出进行预测,效果是比较好的,各期的预测值与实际值偏差不大,其平均相对误差为3.895759%。为了更好地对消费支出进行预测,我们选择对个人可支配收入进行预测,并将预测结果同样代入到上文中求得的消费函数模型中,对内蒙古城镇居民的消费支出进行预测。具体过程如下:

选取1996-2005年的个人可支配收入增量令其为变量Z,对其建立GM(1,1)模型,模型的时间响应函数如下:

模型的参数为,a=-0.161465,b=172.919808,b/a=-1070.941231,模型的平均相对误差为22.328839%,误差较大。为了缩小误差,使预测更加准确,在这里选取马尔可夫预测法对居民可支配收入增量进行预测。由Z的时间响应函数可得,Z的模拟值为(601,292.9765,344.3151,404.6499,475.5573,558.8898,656.8248,771.9211,907.1858,1066.153)

经比较发现实际值和模拟值的差别较大,所以我们根据情况将其划分为4个状态:

根据模拟数据与状态划分,求得状态转移概率矩阵为 :

2005年的可支配收入增量处于第三状态,所以2006年最可能处于第四状态,其预测值为 ,即为1082.99 用新陈代谢法对2006-2008年进行预测,其具体预测结果如下:

由此可知,通过灰色马尔可夫预测城镇居民可支配收入增量,据此结果预测城镇居民可支配收入,并代入灰色计量模型得出的预测结果与实际值相比,其平均相对误差为3.328496%,略优于单纯的灰色计量模型预测的平均相对误差。

将两种方法进行比较可以发现,两种预测方法各有优缺点,单纯采用灰色计量模型对消费支出进行预测时,虽然平均相对误差大于灰色马尔可夫预测法对消费支出做预测的平均相对误差,但这种方法的计算量小,比较简便。而使用马尔可夫预测时,虽然提高了平均相对误差,但计算过程相对灰色计量模型复杂得多,工作量大。

在这里选取用灰色计量模型的方法对内蒙古城镇居民消费支出进行预测,其预测结果如下:

五、结论

通过上述研究可以看出,在内蒙古地区的居民可支配收入保持目前状态的变化趋势下,该地区的居民消费支出将在10年内翻一番,这显然是不能满足地区经济发展需要的。内蒙古地区的经济增长主要依靠投资来拉动,这在一段时间内是对经济增长有利的,但这并不能够长期持续下去,想要经济更好更快的发展,根本还是要靠消费来拉动经济增长。只有这样,经济的发展才是合理的。事实上,我们都知道如果要增加居民消费支出,有一个十分重要的因素就是提高居民的可支配收入。所以在未来一段时期内,政府应该稳步的提高居民的可支配收入,从而达到增加消费,带动经济增长的目的。

参考文献:

[1]刘世彦.居民消费与经济增长关系的分析[J].内蒙古统计,

2001(1).

[2]文峰,姚树荣.居民消费与经济增长关系的实证分析及政策

选择[J].学术论坛,2002(4).

[3]尹世杰.论扩大消费需求的必要性及思路[J].经济评论,

2004(1).