第三章-回归分析预测法.ppt

xiao178601
2 ℃
2020-04-28

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

L/O/G/O第三章回归分析预测法•讲授内容:第一节一元线性回归分析预测法第二节多元线性回归分析预测法第三节非线性回归分析预测法第四节进行回归分析预测时应注意的问题第五节多元回归分析预测案例•思考与练习第三章第一节第一节一元线性回归分析预测法引例美国麻省理工学院气象学家爱德华•罗伦兹为了预报天气，他用计算机求解仿真地球大气的13个方程式。1963年的一次试验中，为了更细致地考察结果，他把一个中间解0.506取出，提高精度到0.506127再送回。而当他到咖啡馆喝了杯咖啡以后回来再看时竟大吃一惊：本来很小的差异，结果却偏离了十万八千里！再次验算发现计算机并没有毛病，罗伦兹发现，由于误差会以指数形式增长，在这种情况下，一个微小的误差随着不断推移造成了巨大的后果。他于是认定这为：“对初始值的极端不稳定性”，即：“混沌”，又称“蝴蝶效应”，亚洲蝴蝶拍拍翅膀，将使美洲几个月后出现比狂风还厉害的龙卷风！其原因在于：蝴蝶翅膀的运动，导致其身边的空气系统发生变化，并引起微弱气流的产生，而微弱气流的产生又会引起它四周空气或其他系统产生相应的变化，由此引起连锁反应，最终导致其他系统的极大变化。•建立模型的意义：在经济领域，一个变量的变化常常受其他多个经济变量的影响。为描述这些变量之间的关系，研究这些变量之间的变化规律，通常要建立计量经济模型，研究模型参数，进而利用计量经济模型进行预测。•假如用Y表示感兴趣的变量，用X表示其他可能与Y有关的变量（X也可能是若干变量组成的向量）。则所需要的是建立一个函数关系Y=f(X)。这里Y称为因变量或响应变量(dependentvariable,responsevariable)，而X称为自变量，也称为解释变量或协变量(independentvariable,explanatoryvariable,covariate)。建立这种关系的过程就叫做回归(regression)。•回归分析（RegressionAnalysis）：是指通过利用数学模型来研究一个变量对另一个或者多个变量的依赖关系，从而通过后者的已知值来估计或预测前者的总体均值或个别值的方法。•回归分析按照自变量的个数，可以分为（1）一元回归：两个变量之间的回归分析（2）多元回归：三个或三个以上变量之间的关系。•回归分析按照因变量和自变量之间具体的变动形式可以分为线性回归和非线性回归。一、一元线性回归模型的建立•（一）一元线性总体回归模型–i=1,2,…,n(3.1)式（3.1）称为一元线性总体回归模型。其中，X为自变量（解释变量），并假定它是可控制的、无测量误差的非随机变量；Y为因变量（被解释变量），是随机变量；u为随机误差（干扰）项，是一个随机变量，可用来代表所有未在模型中考虑的、作用可以相互抵消的随机因素的影响；和是未知却固定的总体参数，称为回归参数，也分别被称为截距和斜率。iiiuYX1001第三章第一节随机误差项的影响因素回归模型中省略的变量测量误差建立的数学模型的形式不够完善人们的随机行为经济变量之间的合并误差12345随机误差项的影响因素•（二）随机误差项的意义和标准假定–随机误差项u是无法直接观测的，为了进行回归分析，通常设其满足以下标准假定：–古典线性回归模型（classicallinearregressionmodel,CLRM）基本假定：1.零均值假定：的期望为0，即：i=1,2,…,n2.同方差假定：的方差为一常数，即：i=1,2,…,niu0)(iuEiu2)(iuVar一、一元线性回归模型的建立第三章第一节3.非自相关假定：与相互独立，即：i≠j;i,j=1,2,…,n4.随机误差项与自变量不相关，即：i,j=1,2,…,n5.（i=1,2,…,n）服从正态分布。iuju0),(jiuuCovjX0),(ijuXCoviuiu一、一元线性回归模型的建立第三章第一节•（三）样本回归模型–样本回归模型：i=1,2,…,n(3.2)式中,和是根据所获得的一个样本对总体回归参数，和的估计，n为该样本的容量，被称为残差。对于给定的一个样本，总体回归模型式（3.1）的近似估计为：(3.3)式（3.3）称为样本回归方程，又称为经验方程，为的估计。iiiexy10ˆˆ0ˆ1ˆie01iuxy10ˆˆˆiyˆiyie一、一元线性回归模型的建立第三章第一节图3.1观测值散点图二、一元线性回归模型参数的估计用样本的所有残差的平方和来综合反映残差的总量大小就显得更为合适，这种方法称为最小二乘法（OLS）：所选择的回归模型应该使所有观测值的残差平方和达到最小。具体表示就是：21022)ˆˆ()ˆ(iiiiixyyyeQ第三章第一节二、一元线性回归模型参数的估计根据微分学求极值的原理，对上式求偏导，并令其为零得方程组:21010iiiiiixxyxxny第三章第一节二、一元线性回归模型参数的估计得总体回归参数:iiiiiiiixnynxxnyxyxn11)(10221第三章第一节•如果两个定量变量没有关系，就谈不上建立模型或进行回归。但怎样才能发现两个变量有没有关系呢？•最简单的直观办法就是画出它们的散点图。下面是四组数据的散点图；每一组数据表示了两个变量x和y的样本。-3-2-1012-2-1012(a)xy-2-1012-2-1012(b)xy-2-1012-2-1012(c)xy-3-2-1012302468(d)xy不相关正线性相关负线性相关相关但非线性相关EViews软件实现：参考P38例3-1（1）建立工作文件：•菜单方式：File\New\Workfile，•命令格式：CREATE时间频率类型起始期终止期（2）输入统计资料：•DATAYX（3）估计回归模型参数：•菜单方式：在数组窗口中点击Procs\MakeEquation。•命令格式：LS被解释变量C解释变量图3-2人均可支配收入和消费性支出相关图表3-1我国城镇居民消费函数的输出结果例3.2某地区居民家庭可支配收入与家庭消费支出的资料如表3.2所示表3.2某地区居民家庭收入支出资料（单位：百元）表3-3某地区家庭消费函数的输出结果一般是根据样本数据建立样本回归函数(或样本回归模型)，用样本回归方程(或样本回归模型)作为总体回归函数(或总体回归模型)的估计式并以此描述总体变量间的依存规律和实际关系。总体回归模型与样本回归模型的主要区别是：(1)描述的对象不同。(2)建立模型的依据不同。(3)模型性质不同。总体回归模型与样本回归模型的联系是：样本回归模型是总体回归模型的一个估计式，之所以建立样本回归模型，目的是用来估计总体回归模型。最小二乘估计量的性质一个用于考察总体的估计量，可从如下几个方面考察其优劣性：（1）线性。即它是否是另一个随机变量的线性函数；（2）无偏性。即它的均值或期望是否等于总体的真实值；（3）有效性。即它是否在所有的线性无偏估计量中具有最小方差；（4）渐近无偏性。即样本容量趋于无穷大时，它的均值序列趋于总体的真值；（5）一致性。即样本容量趋于无穷大时，它是否依概率收敛于总体的真值；（6）渐近有效性。即样本容量趋于无穷大时，它在所有的一致估计量中具有最小的渐近方差。这里，前三个准则也称作估计量的小样本性质，因为一旦某估计量具有该类性质，它是不以样本的大小而改变的。拥有这类性质的估计量称为最佳线性无偏估计量(BLUE：bestlinearunbiasedestimators)。后三个准则称为估计量的大样本或渐近性质。如果小样本情况下不能满足估计的准则，则应该扩大样本容量，考察参数估计量的大样本性质。用最小二乘法得到的参数估计，具有线性、无偏性和有效性（或最小方差性）三种最重要的统计性质。1.线性无偏性(unbiasedness)•无偏性：估计量抽样分布的数学期望等于被估计的总体参数P()BA无偏有偏ˆˆ有效性(efficiency)有效性：对同一总体参数的两个无偏点估计量，有更小标准差的估计量更有效AB的抽样分布的抽样分布1ˆ2ˆP()ˆˆ一致性(consistency)•一致性：随着样本量的增大，估计量的•值越来越接近被估计的总体参数AB较小的样本量较大的样本量P()ˆˆ最小方差性证明略。三、一元线性回归模型的检验•（一）经济检验–经济检验就是检验估计出来的参数的符号、大小是否与经济理论和实际经验相符合，即是否具有经济意义。如果所估计出来的参数没有经济意义，则该模型不能用来进行预测。第三章第一节•（二）统计检验–1.对回归参数的检验（t检验）——解释变量的显著性检验对回归参数进行t检验的程序为：（1）提出假设（2）计算T统计量的值（3）查出临界值并做出判断1三、一元线性回归模型的检验第三章第一节通常，只要t统计量的值大于2，则基本上能以95%的置信度认为该变量的影响是显著的。–2.回归方程的拟合优度（判定系数R2）——模型的拟合优度检验总变差是因变量的样本观测值与其样本均值的离差平方和，反映了因变量的总变异程度，即，它又被称为总的离差平方和，记为TSS（totalsumofsquares）。是因变量的样本回归值与其样本均值的离差平方和，通常称为回归平方和或回归变差，记为ESS（explainedsumofsquares）；是因变量的回归残差的平方和，通常称为残差平方和或剩余变差，记为RSS（residualsumofsquares）。2)(yy2)ˆ(yyQeyy22)ˆ(三、一元线性回归模型的检验第三章第一节拟合优度：模型对样本数据的近似程度。可以用回归平方和占总的离差平方和的比重来衡量模型的拟合优良程度，称其为判定系数，记作，即：判定系数的取值范围为0≤≤1，判定系数的值越接近于1，回归平方和在总的平方和中所占的比重就越大，样本回归方程对因变量观测值的拟合就越好；经济意义：在被解释变量的变动中，由模型中解释变量变动所引起的比例，即变动的是由模型中解释变量变动所引起。2rTSSRSSTSSESSr122r2r2r三、一元线性回归模型的检验第三章第一节y2100%r反之，判定系数的值越接近于0，回归平方和在总的平方和中所占的比重就越小，样本回归方程对因变量观测值的拟合就越差。2r222222)()()(iiiiiiiiyyxxnyxyxnr三、一元线性回归模型的检验第三章第一节判定系数R2的值越接近于1，则表明模型对样本数据的拟合优度越高。经济意义：定量的描述了y的变化中可以用回归模型来说明的部分，即模型的可解释程度。3.对回归方程的显著性检验（F检验）——模型的显著性检验：检验模型对总体的近似程度回归方程显著性检验是对回归模型总体的显著性进行检验，也就是判定回归方程的所有解释变量x对被解释变量y的影响的显著性，即检验是否所有参数全部为零。这实际上就是对回归方程拟合优度的检验，F检验满足这一要求。由于一元线性回归模型只有一个解释变量，所有F检验就是检验回归参数是否显著不为0。i三、一元线性回归模型的检验第三章第一节•（三）经济计量检验–DW检验是序列相关的一种有效检验方法，检验步骤如下：1.建立假设。2.计算检验统计量的值。3.根据给定的显著性水平α、样本容量n和自变量个数m，查DW检验临界值表可得到d统计量的下限和上限。LdUd三、一元线性回归模型的检验第三章第一节4.根据以下准则做出判断（如图3-1所示）：（1）若d，认为之间存在正的序列相关（2）若d4-，认为之间不存在序列相关；（3）若d4-，认为之间存在负的序列相关;（4）若≤d≤或者4-≤d≤4-，则不能确定之间是否存在序列相关。UdLdUdUdUdLdLdLd图3-1DW检验判定区域图iuiuiuiu三、一元线性回归模型的检验第三章第一节•（一）点预测–因变量的点预测值为:(3