一、内容提要,什么是cpi指数

指数 8
第二章经典单方程计量经济学模型:一元线性回归模型
一、内容提要 本章介绍了回归分析的基本思想与基本方法。
首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。
总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。
本章学习的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。
同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。
本章的另一个学习的重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。
统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。
后者又包括两个层次:第
一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第
二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。
本章还有三方面的内容不容忽视。

一,若干基本假设。
样本回归函数参数的估计、对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。

二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。
Goss-markov定理表明OLS估计量是最佳线性无偏估计量。

三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测、预测置信区间的计算及其变化特征等。

二、典型例题分析 例
1、令Y表示一名妇女生育孩子的数目,X表示该妇女接受过教育的年数。
生育率 对教育年数的简单回归模型为 Y=β0+β1X+µ
1
(1)随机扰动项µ包含什么样的因素?它们可能与教育水平相关吗?
(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
解答:
(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。
有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。

(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平X相关时,上述回归 模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,违背了基本假设。

2.已知回归模型E=α+βN+µ,式中E为某类公司一名新员工的起始薪金(元), N为所受教育水平(年)。
随机扰动项µ的分布未知,其他所有假设都满足。

(1)从直观及经济角度解释α和β。

(2)OLS估计量αˆ和βˆ满足线性性、无偏性及有效性吗?简单陈述理由。

(3)对参数的假设检验还能进行吗?简单陈述理由。
解答:
(1)α+βN为接受过N年教育的员工的总体平均起始薪金。
当N为零时,平均薪金 为α,因此α表示没有接受过教育员工的平均起始薪金。
β是每单位N变化所引起的E的 变化,即表示每多接受一年学校教育所对应的薪金增加值。

(2)OLS估计量αˆ和仍βˆ满足线性性、无偏性及有效性,因为这些性质的成立无需随机扰动项µ的正态分布假设。

(3)如果µ的分布未知,则所有的假设检验都是无效的。
因为t检验与F检验是建立在µ的正态分布假设之上的。

3、在例2中,如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化? 解答: 首先考察被解释变量度量单位变化的情形。
以E*表示以百元为度量单位的薪金,则E=E*×100=α+βN+µ 由此有如下新模型 E*=(α/100)+(β/100)N+(µ/100)
2 或 E*=α*+β*N+µ* 这里α*=α/100,β*=β/100。
所以新的回归系数将为原始模型回归系数的1/100。
再考虑解释变量度量单位变化的情形。
设N*为用月份表示的新员工受教育的时间长度,则N*=12N,于是 E=α+βN+µ=α+β(N*/12)+µ 或 E=α+(β/12)N*+µ 可见,估计的截距项不变,而斜率项将为原回归系数的1/12。

4、对没有截距项的一元回归模型 Yi=β1Xi+µi 称之为过原点回归(regrissionthroughtheorigin)。
试证明
(1)如果通过相应的样本回归模型可得到通常的正规方程组 ∑ei=0∑eiXi=
0 则可以得到β1的两个不同的估计值: β~=Y1
X, βˆ
1 = (∑XiYi) (∑
X 2i ) 。

(2)在基本假设E(µ)=0下,β~与βˆ均为无偏估计量。
i
1 1
(3)拟合线Yˆ = βˆ
X ~通常不会经过均值点(
X,Y),但拟合线
Y = β~
X 则相反。

1 1
(4)只有βˆ1是β1的OLS估计量。
解答:
(1)由第一个正规方程∑et=0得 ∑(Yt − β~X1t ) =
0 或 ∑Yt = β~
1
X t 求解得 β~=Y/X1 由第2∑个正规方程Xt(Yt−βˆ1Xt)=0得 ∑XtYt = βˆ
1
X 2t 求解得 βˆ
1 = (∑ XtYt )/(∑
X 2t )
3
(2)对于β~=Y/X,求期望
1 E(β~)=E(Y1 X)=1E[1(βX+µ)]Xn1tt =1[E{β1Xt)+E(µ)]
X n t =Xβ=βX11 这里用到了Xt的非随机性。
对于 βˆ
1 = (∑ XtYt )/(∑
X 2t ) ,求期望 E(βˆ1) = E(∑
X tYt / ∑
X 2t ) ∑∑=
(1)E(XY)=
(1)E[X(βX+µ)] ∑∑XX2 tt t
2 t1t t t ∑∑=
(1)β∑∑Xt21 (
X 2t ) + ( 1)
X 2t XtE(µt)=β
1 ∑∑
(3)要想拟合值Yˆ=βˆ1X通过点(
X,Y),βˆ1X必须等于
Y。
但βˆ1X= XtYtX,
X 2t 通常不等于
Y。
这就意味着点(
X,Y)不太可能位于直线Yˆ=βˆ1X上。
相反地,由于β~X=
Y,所以直线Yˆ=β~X经过点(
X,Y)。

1 1
(4)OLS方法要求残差平方和最小 Min RSS = ∑ e 2t = ∑(Yt − βˆ1Xt)
2 关于βˆ1求偏导得 ∑∂RSS=
2 ∂βˆ
1 (Yt−βˆ1Xt)(−Xt)=
0 即 ∑Xt(Yt−βˆ1Xt)=
0 βˆ
1 = (∑ XiYi) (∑
X 2i ) 可见βˆ1是OLS估计量。

5.假设模型为Yt=α+βXt+µt。
给定n个观察值(X1,Y1),(X2,Y2),…, (Xn,Yn),按如下步骤建立β的一个估计量:在散点图上把第1个点和第2个点连接起来
4 并计算该直线的斜率;同理继续,最终将第1个点和最后一个点连接起来并计算该条线的斜 率;最后对这些斜率取平均值,称之为βˆ,即β的估计值。

(1)画出散点图,给出βˆ的几何表示并推出代数表达式。

(2)计算βˆ的期望值并对所做假设进行陈述。
这个估计值是有偏的还是无偏的?解 释理由。

(3)证明为什么该估计值不如我们以前用OLS方法所获得的估计值,并做具体解释。
解答:
(1)散点图如图2-1所示。
(X2,Y2) (Xn,Yn) (X1,Y1) 图2-
1 首先计算每条直线的斜率并求平均斜率。
连接(X1,Y1)和(Xt,Yt)的直线斜率为 (Yt−Y1)/(Xt−X1)。
由于共有n-1条这样的直线,因此 ∑βˆ=1n[Yt−Y1] n−1t=2Xt−X1
(2)因为X非随机且E(µt)=
0,因此 E[Yt−Y1]=E[(α+βXt+µt)−(α+βX1+µ1)]=β+E[µt−µ1]=β Xt−X1 Xt−X1 Xt−X1 这意味着求和中的每一项都有期望值β,所以平均值也会有同样的期望值,则表明是无偏 的。

(3)根据高斯-马尔可夫定理,只有β的OLS估计量是最佳线性无偏估计量,因此, 这里得到的βˆ的有效性不如β的OLS估计量,所以较差。

6.对于人均存款与人均收入之间的关系式St=α+βYt+µt使用美国36年的年度数 据得如下估计模型,括号内为标准差: Sˆt=384.105+0.067Yt(151.105)(0.011)
5 R2=0.538
(1)β的经济解释是什么?
(2)α和β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话, 你可以给出可能的原因吗?
(3)对于拟合优度你有什么看法吗?
(4)检验是否每一个回归系数都与零显著不同(在1%水平下)。
同时对零假设和备择假 设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。
你的结论是什么?解答:
(1)β为收入的边际储蓄倾向,表示人均收入每增加1美元时人均储蓄的预期平均变 化量。

(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此α符号应为负。
储蓄是收入的一部分,且会随着收入的增加而增加,因此预期β的符号为正。
实际的回归式中,β的符号为正,与预期的一致。
但截距项为正,与预期不符。
这可能是 由于模型的错误设定造成的。
如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对截距项的估计产生影响;另一种可能就是线性设定可能不正确。

(3)拟合优度刻画解释变量对被解释变量变化的解释能力。
模型中53.8%的拟合优度,表明收入的变化可以解释储蓄中53.8%的变动。

(4)检验单个参数采用t检验,零假设为参数为零,备择假设为参数不为零。
双变量情形下,在零假设下t分布的自由度为n-2=36-2=34。
由t分布表知,双侧1%下的临界值位于2.750与2.704之间。
斜率项计算的t值为0.067/0.011=6.09;截距项计算的t值为384.105/151.105=2.54。
可见斜率项计算的t值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设。
附录:一些理论结果的证明
1、令βˆYX和βˆXY分别为Y对X回归和X对Y回归中的斜率,证明 βˆYXβˆXY=r2其中r为X与Y之相的线性相关系数。
证明:容易知道,在上述两回归中斜率项分别为
6 ∑∑βˆ=xiyi,βˆ=xiyi∑∑YXxi2XYyi2 于是 ∑∑(∑)βˆβˆ=xiyixiyi= xiyi2=r2 ∑∑∑∑YXXY xi2 yi2 xi2yi2
2、记样本回归模型为Yi=βˆ0+βˆ1Xi+ei,试证明: 1)估计的Y的均值等于实测的Y的均值:Yˆ=
Y 2)残差和为零,从而残差的均值为零:∑ei=0,e=
0 3)残差项与X不相关:∑eiXi=
0 4)残差项与估计的
Y 不相关: ∑ ei Yˆi = 0; 证明:1)由于 Yˆ=βˆ+βˆX=(Y−βˆX)+βˆX=Y+βˆ(X−X) i
0 1i
1 1i 1i 故 Yˆ =
Y + βˆ
1 1n ∑(Xi − X) =
Y 这里用到了∑xi=∑(Xi−X)=
0 2)由一元回归中正规方程组中的第一个方程 ∑(Yi−βˆ0−βˆ1Xi)=
0 知:∑ei=
0, e = 1n ∑ ei =
0 3)由一元回归中正规方程组中的第二个方程 ∑(Yi−βˆ0−βˆ1Xi)Xi=
0 知:∑eiXi=
0 4)由2)及3)易知 ∑ e i Yˆi = ∑ei(βˆ
0 + βˆ1Xi) = βˆ0∑ei + βˆ1∑eiXi =
0 3、对一元线性回归模型Yi=β0+β1Xi+µi,试证明普通最小二乘估计量βˆ1在所有 线性无偏估计量中具有最小方差性。

7 证:设βˆ1*是其他方法得到的关于β1的线性无偏估计量: βˆ1*=∑ciYi 其中,ci=ki+di,di为不全为零的常数,于是 E(βˆ1*)=E(∑ciYi)=∑ciE(Yi)=∑ci(β0+β1Xi)=β0∑ci+β1∑ciXi 由βˆ1*的无偏性,即E(βˆ1*)=β1可知: β0∑ci+β1∑ciXi=β
1 已知∑ci=
0,从而∑ciXi=1βˆ1*的方差var(βˆ1*)=var(∑ciYi)=∑ci2var(Yi)=∑ci2var(µi)=∑ci2σ
2 =∑(ki + di)2σ
2 = ∑ k 2i σ
2 +∑di2σ
2 + 2σ 2∑kidi 由于 ∑kidi = ∑ki(ci −ki) = ∑kici − ∑ k 2i ∑∑∑∑∑=xic−k2=Xici−Xci−k2=1−1=0∑∑∑∑xi2iixi2ixi2xi2 ∑∑∑∑故var(βˆ*)=k2σ2+d2σ2=1σ2+σ2d2=var(βˆ)+σ2d2 ∑
1 i ixi2 i
1 i 因为 ∑ d 2i ≥
0 所以var(βˆ1*)≥var(βˆ1) 当di=
0,(i=1,2,n)等号成立,此时,ci=ki,βˆ1*就是OLS估计量βˆ
1。

4、试证明一元线性回归模型随机扰动项µ的方差σ2的无偏估计量为σˆ2= ei2 。
n−
2 证:给定一组样本{Xi,Yi},容易写出模型Yi=β0+β1Xi+µi的离差形式为: yi=β1xi+(µi−µ) 根据样本回归函数的离差形式: yˆi=βˆ1xi 易知
8 Σei2=Σ(yi−yˆi)
2 =Σ((β1−βˆ1)xi+(µi−µ))
2 =Σ((β1−βˆ1)2xi2+2(β1−βˆ1)xi(µi−µ)+(µi−µ)2) =Σβ1−βˆ1)2xi2+Σ(µi−µ)2−2Σ(Σkiµi)xi(µi−µ) =Σ(β1−βˆ1)2xi2+Σ(µi−µ)2−2ΣxiµiΣkiµi+2µΣxiΣkiµi =Σ(β−βˆ)2x2+Σ(µ−µ)2−2ΣxµΣxiµi
1 1 i i iiΣx2 i 因为 ∑∑∑∑E(β1−βˆ1)2xi2= xi2var(βˆ1)= xi2σ2=σ2xi2 E∑(µi − µ)
2 =
E ( ∑ µ 2i − 2µ∑µi + nµ) =
E ( ∑ µ 2i − nµ 2) = (n −1)σ
2 (∑)∑∑xµ2 xi2µi2+2(xiixj)(µµj)   E ii2 =E i≠j2 =σ
2 ∑∑xi xi    所以
E ( ∑ e 2i ) =σ
2 +(n−1)σ
2 −2σ
2 = (n−2)σ
2 从而 E(Σei2)=σ2n−
2
5、对一元线性回归模型Y=β+βX+µ,试证明Cov(βˆ,βˆ)=−σ2X。
i
0 1i i x01
2 i 证: Cov(βˆ
0,βˆ1)=E(βˆ0−β0)(βˆ1−β1)=E(βˆ0−E(βˆ0))(β1−E(βˆ1))=E(Y−βˆ1X−(Y−XE(βˆ1)))(β1−E(βˆ1))=−XE(βˆ1−E(βˆ1))(β1−E(βˆ1))=−XE(βˆ1−E(βˆ1))2=−Xvar(βˆ1) ∑=−σ2X xi2
9 四、补充练习题 2-
1.解释下列概念:1)总体回归函数3)随机的总体回归函数 2)样本回归函数4)线性回归模型 5)随机误差项µi 6)残差项ei 7)条件期望9)回归系数的估计量11)最大似然法13)总离差平方和15)残差平方和17)拟合优度检验2-
2.判断正误并说明理由: 8)回归系数或回归参数10)最小二乘(平方)法12)估计量的标准差14)回归平方和16)协方差18)t检验 1)随机误差项µi和残差项ei是一回事 2)总体回归函数给出了对应于每一个自变量的因变量的值3)线性回归模型意味着变量是线性的4)在线性回归模型中,解释变量是原因,被解释变量是结果5)随机变量的条件均值与非条件均值是一回事2-
3.回答下列问题:1)总体方差与参数估计方差的区别与联系。
2)随机误差项µi和残差项ei的区别与联系。
3)根据最小二乘原理,所估计的模型已经使得拟合误差达到最小,为什么还要讨论模型的拟合优度问题? 4)为什么用决定系数R2评价拟合优度,而不用残差平方和作为评价标准?5)回归分析与相关分析的区别与联系。
6)最小二乘法和最大似然法的基本原理各是什么?说明它们有何区别?7)为什么要进行解释变量的显著性检验?8)是否任何两个变量之间的关系,都可以用两变量线性回归模型进行分析? 10 2-
4.表2-2列出若干对自变量与因变量。
对每一对变量,你认为它们之间的关系如何? 是正的、负的、还是无法确定?并说明理由。
表2-2因变量
(1)GNP
(2)个人储蓄
(3)小麦产出
(4)美国国防开支
(5)棒球明星本垒打的次数
(6)总统声誉
(7)学生计量经济学成绩
(8)日本汽车的进口量 自变量利率利率降雨量前苏联国防开支其年薪任职时间其统计学成绩美国人均国民收入 2-
5.参数估计量的无偏性和有效性的含义是什么?从参数估计量的无偏性和有效性证 明过程说明,为什么说满足基本假设的计量经济学模型的普通最小二乘参数估计量才具有无 偏性和有效性? 2-
6.试证明过原点回归模型
Yi=β1Xi+µi中斜率项有 ∑Var(βˆ1)= σ
2 X 2i 2-
7.为什么在一元线性方程中,最小二乘估计量与极大似然估计量的表达式是一致的? ∑证明σ2的ML估计量σˆ2=1ne2是有偏的。
ni=1i 2-
8.现代投资分析的特征线涉及如下回归方程:rt=β0+β1rmt+ut;其中:r表示股 票或债券的收益率;rm表示有价证券的收益率(用市场指数表示,如标准普尔500指数);t表示时间。
在投资分析中,β1被称为债券的安全系数β,是用来度量市场的风险程度的,即市场的发展对公司的财产有何影响。
依据1956~1976年间240个月的数据,Fogler和Ganpathy得到IBM股票收益率的回归方程如下: rˆt=0.7264+1.0598rmt (0.3001)(0.0728) R2=0.4710 要求:
(1)解释回归参数的意义; 11
(2)如何解释R2?
(3)安全系数β>1的证券称为不稳定证券,建立适当的零假设及备选假设,检验IBM 是否是易变股票(α=5%)。
∑2-
9.已知模型Y=α+βX+µ,证明:估计量α可以表示为:αˆ=n(1−XW)
Y, i i i i=1n ii ∑这里Wi= xi。
xi2 2-10.一个消费分析者论证了消费函数Ci=α+βYi是无用的,因为散点图上的点(Ci, Yi)不在直线Ci=α+βYi上。
他还注意到,有时Yi上升但Ci下降。
因此他下结论:Ci不 是Yi的函数。
请你评价他的论据(这里Ci是消费,Yi是收入)。
2-11.证明:仅当R2=1时,Y对X的线性回归的斜率估计量等于X对Y的线性回归 的斜率估计量的倒数。
2-12.证明:相关系数的另一个表达式是:r=βˆSx1Sy 其中βˆ1为一元线性回归模型 一次项系数的估计值,Sx、Sy分别为X与Y的样本标准差。
2-13.对于经济计量模型:Yi=β0+β1Xi+µi,其OLS估计参数β1的特性在下列 情况下会受到什么影响:
(1)观测值数目n增加;
(2)Xi各观测值差额增加;
(3)Xi各观测值近似相等;
(4)E(µ2)=
0。
2-14.假定有如下的回归结果:Yˆ=2.6911−0.4795X,其中,Y表示美国的咖啡的 t t 消费量(每天每人消费的杯数),X表示咖啡的零售价格(美元/杯),t表示时间。

(1)这是一个时间序列回归还是横截面序列回归?做出回归线;
(2)如何解释截距的意义,它有经济含义吗?如何解释斜率?
(3)能否求出真实的总体回归函数?
(4)根据需求的价格弹性定义:弹性=斜率×(X/Y),依据上述回归结果,你能求出 12 对咖啡需求的价格弹性吗?如果不能,计算此弹性还需要其他什么信息? 2-15.假设某人通过一容量为19的样本估计了如下消费函数Ci=α+βYi+µi,并获 得下列结果: Cˆi=15+0.81Yi (3.1)(18.7)R2=0.98要求:
(1)利用t值检验假设:β=0(取显著水平为5%);
(2)确定参数估计量的标准差;
(3)构造β的95%的置信区间,这个区间包括0吗? 2-16.表2-3给出了某社区每月家庭的收入X与消费支出Y的调查数据。
表2-3每月收入X(元) 800100012001400160018002000220024002600 每月消费支出Y(元) 550,600,650,700,750650,700,740,800,850,880790,840,900,940,980800,930,950,1030,1080,1130,11501020,1070,1100,1160,1180,12501100,1150,1200,1300,1350,14001200,1360,1400,1440,14501350,1370,1400,1520,1570,1600,16201370,1450,1550,1650,1750,18901500,1520,1750,1780,1800,1850,1910 要求:
(1)对每一收入水平,计算平均的消费支出,E(Y|Xi),即条件期望值;
(2)以收入为横轴、消费支出为纵轴作散点图;在散点图中,做出
(1)中的条件均 值点;你认为X与Y之间、X与Y的均值之间的关系如何?
(3)写出其总体回归函数。

(4)如果对每一个X值,随机抽取一个Y值,结果如下: Y700650900950110011501200140015501500 X800100012001400160018002000220024002600 求样本回归函数。

(5)在同一个图中,做出总体回归线与样本回归线,它们相同吗?2-17.表2-4给出了某国1990~1996年间的CPI指数与S&P500指数。
要求: 13
(1)以CPI指数为横轴、S&P指数为纵轴做图;
(2)你认为CPI指数与S&P指数之间关系如何?
(3)考虑下面的回归模型:S&Pt=β1+β2CPIt+µt,根据表中的数据运用OLS 估计上述方程,并解释所得结果。
表2-
4 年份 CPI S&P500指 年份 1990 130.7 334.59 1994 1991 136.2 376.18 1995 1992 140.3 415.74 1996 1993 144.5 451.41 CPI
148.2152.4159.6 S&P500指数460.33541.64670.83 2-18.表2-5给出了美国30所知名学校的MBA学生1994年基本年薪(ASP)、GPA分数(从1~4共四个等级)、GMAT分数以及每年学费(X)的数据。
要求:
(1)用双变量回归模型分析GPA是否对ASP有影响?
(2)用合适的回归模型分析GMAT分数是否与ASP有关?
(3)每年的学费与ASP有关吗?你是如何知道的?如果两变量之间正相关,是否意味着进到最高费用的商业学校是有利的;
(4)你同意高学费的商业学校意味着高质量的MBA成绩吗?为什么? 表2-
5 学校 ASP GPA GMAT
X Harvard (美元) 102630 3.4 (美元) 650 23894 Stanford 100800 3.3 665 21189 Columbian 100480 3.3 640 21400 Dartmouth 95410 3.4 660 21225 Wharton 89930 3.4 650 21050 Northwestern 84640 3.3 640 20634 Chicago 83210 3.3 650 21656 MIT 80500 3.5 650 21690 Virginia 74280 3.2 643 17839 UCLA 74010 3.5 640 14496 Berkeley 71970 3.2 647 14361 Cornell 71970 3.2 630 20400 NUY 70660 3.2 630 20276 Duke 70490 3.3 623 21910 Carnegie
Mellon 59890 3.2 635 20600 NorthCarolina 69880 3.2 621 10132 14 Michigan 67820 3.2 630 20960 Texas 61890 3.3 625 8580 Indiana 58520 3.2 615 14036 Purdue 54720 3.2 581 9556 Case
Western 57200 3.1 591 17600 etown 69830 3.2 619 19584 MichiganState 41820 3.2 590 16057 PennState 49120 3.2 580 11400 SouthernMethodist 60910 3.1 600 18034 Tulane 44080 3.1 600 19550 Illinois 47130 3.2 616 12628 Lowa 41620 3.2 590 9361 Minnesota 48250 3.2 600 12618 Washington 44140 3.3 617 11436 2-19.表
2-6给出了1988年9个工业国的名义利率(Y)与通货膨胀率(X)的数据。
要求:
(1)以利率为纵轴、通货膨胀率为横轴做图;
(2)用OSL进行回归分析;
(3)如果实际利率不变,则名义利率与通货膨胀率的关系如何? 表2-6国家澳大利亚加拿大法国德国意大利 Y(%)11.99.47.54.011.3 X(%)7.74.03.11.64.8 国家墨西哥 瑞典英国美国 Y(%)66.32.210.37.6 X(%)51.02.06.84.4 补充练习参考答案 2-
1.答: ⑴总体回归函数是指在给定Xi下Y分布的总体均值与Xi所形成的函数关系(或者说: 将总体被解释变量的条件期望表示为解释变量的某种函数)。
⑵样本回归函数指从总体中抽出的关于
Y、X的若干组值形成的样本而建立的回归函 数。
⑶随机的总体回归函数指含有随机误差项的总体回归函数(是相对与条件期望形式而言 15 的)。
⑷教材中所讲的线性回归模型既指对变量是线性的,也指对参数β为线性的。
即解释变量与参数β只以它们的1次方出现。
⑸随机误差项也称误差项,是一个随机变量,针对总体回归函数而言。
⑹残差项是一随机变量,针对样本回归函数而言。
⑺条件期望又称条件均值,指X取特定Xi值时的Y的期望值。
⑻回归系数(或回归参数)指回归模型中β
0、β1等未知但却是固定的参数。
⑼回归系数的估计量指用βˆ
0、βˆ1等表示的用已知样本提供的信息所估计出来总体未知 参数的结果。
⑽最小二乘法又称最小平方法,指使估计的剩余平方和最小的原则确定样本回归函数的 方法。
⑾最大似然法又称最大或然法,指用产生该样本概率最大的原则去确定样本回归函数的 方法。
⑿估计量的标准差是度量一个变量变化大小的测度量。
⒀总离差平方和用TSS表示,用以度量被解释变量的总变动。
⒁回归平方和用ESS表示,用以度量由解释变量变化引起的被解释变量的变化部分。
⒂残差平方和用RSS表示,用以度量实际值与拟合值之间的差异,是由除解释变量以 外的其他因素引起的被解释变量变化的部分。
⒃协方差用Cov(
X,Y)表示,是用来度量
X、Y二个变量关联程度的统计量。
⒄拟和优度检验指检验模型对样本观测值的拟合程度,用R2表示,该值越接近
1,模 型对样本观测值拟合得越好。
⒅t检验是针对每个解释变量进行的显著性检验,即构造一个t统计量,如果该统计量 的值落在置信区间外,就拒绝原假设。
2-
2.答:
(1)错误;随机误差项是针对总体回归模型而言的,它是模型中其他没有包含的因素 的综合体;而残差项是针对样本回归模型而言的,它是实际观测值与样本回归线上值的离差。
两者的含义不同,后者只能说成是对前者的一个估计。
16
(2)错误;总体回归函数给出了对应于第一个自变量的被解释变量的均值。

(3)(在不考虑参数非线性的情况下是)正确的。

(4)正确;这是建立回归模型的前提。

(5)错误;只有在解释变量与随机误差项不相关时,随机误差项与条件均值与非条件均值才是一回事。
在基本假设成立的情况下,两者是一回事。
2-
3.答:
(1)总体方差又称随机误差项的方差,用Var(µiXi)=σ2表示。
它是参数估计量方 差的有机组成部分。
如在一元线性回归模型Yi=β0+β1Xi+µi中, ∑∑∑Var(βˆ1)= σ
2,Var(βˆ)=xi20n Xi2σ2,xi2
(2)随机误差项µi是指总体观测值与回归方程理论值之间的偏差,而残差项ei是指样 本观测值与回归方程理论值之间的偏差,二者是有区别的;但是,由于总体观察值无法得到,从而造成总体回归函数事实上是未知的,因此,一般的做法是通过样本观测获得的信息去估 计总体回归函数,这样,残差ei就是随机误差项µi的一个样本估计量。

(3)普通最小二乘法所保证的最好拟合是同一个问题内部的比较,即使用给出的样本 数据满足残差的平方和最小;拟合优度检验结果所表示的优劣可以对不同的问题进行比较, 即可以辨别不同的样本回归结果谁好谁坏。

(4)判定系数
R2=ESS=1−RSS,含义为由解释变量引起的被解释变量的变化占 TSS TSS 被解释变量总变化的比重,用来判定回归直线拟合的优劣。
该值越大说明拟合得越好;而残 差平方和与样本容量关系密切,当样本容量比较小时,残差平方和的值也比较小;尤其是不 同样本得到的残差平方和是不能做比较的。
此外,作为检验统计量的一般应是相对量而不能 用绝对量,因而不能使用残差平方和判断模型的拟合优度。

(5)回归分析是讨论被解释变量与一个或多个解释变量之间具体依存关系的分析方法; 相关分析是讨论变量之间线性相关程度的分析方法;二者的区别在于:研究的目的不同,相 关分析着重探讨变量间的关联程度,而回归分析却要进一步探寻变量间具体依赖关系,即希 望根据解释变量的固定值去估计和预测被解释变量的平均值;对变量的处理不同,相关分析 对称地处理相互联系的变量,而回归分析必须明确解释变量与被解释变量。
二者的联系在于: 回归分析建立在相关分析基础之上,当相互有关联的变量进一步有因果关系时,可进一步进 17 行回归分析。
相关分析中线性相关系数的平方等于回归分析中的拟合优度。

(6)最小二乘法和最大似然法都是常用于对线性回归模型参数进行估计的方法。
最小
二乘法的基本原理是:用使估计的剩余平方和最小的原则确定样本回归函数;最大似然法的 基本原理是:用产生该样本概率最大的原则去确定样本回归函数。
它们的区别在于:最小
乘法的估计量具有线性、无偏性与有效性,随机误差项方差估计量也是无偏的;而最大似然 法的估计量仅具有线性、无偏性、有效性,其随机误差项方差的估计量是有偏的。

(7)对解释变量进行显著性检验的目的,是为了决定该变量是否应作为解释变量被保
留在模型中,如果该变量对被解释变量的影响并不显著,就应该将其剔除,并寻找其他可能 的变量建立模型。

(8)不是。
当变量间存在非线性关系时,可建立非线性回归模型。
2-
4.答:
(1)无法确定;
(2)正的因果关系;
(3)因果关系但不能确定正负;
(4)正的因果关系;
(5)正的相关关系;
(6)无法确定;
(7)正的因果关系;
(8)正的相关关系。
2-
5.答:参数估计量的无偏性是指:参数估计量βˆ的均值等于模型参数值,即 E(βˆ0)=β
0,E(βˆ1)=β
1。
参数估计量的有效性是指:在所有线性、无偏估计量中,该参 数估计量的方差最小。
从参数估计量的无偏性和有效性的证明过程中看出,得出无偏性、有 效性是利用了随机误差项具有零均值和同方差及随机误差项与解释变量之间不相关的基本 假设,所以说只有满足基本假设的
OLS参数估计量才具有无偏性和有效性。
2-
6.证明: 易知,模型Yi=β1Xi+µi的参数的OLS估计量为: 因此, ∑∑∑∑∑∑βˆ1= XiYi=
X 2i Xi(β1X2i+µi)=β1+Xi Xiµi
X 2i 18 ∑∑Var(βˆ1)=Var(β+ Xiµi)
X 2i
2 X σ
2 ∑∑∑=  i
X 2  Var(µi) = X2  i i 2-
7.答: 在一元线性方程中,最小二乘估计量与最大似然估计量的表达式之所以会一致,原因在 于两种方法都存在对∑(Yi−(βˆ0+βˆ1Xi))2式求极小的步骤。
∑证明最大似然估计量σˆ2=1ne2是有偏的过程如下:ni=1i ∑∑对σˆ2=1ne2式两边取数学期望,并考虑E(i ei2)=σ2得 ni=
1 n−
2 ∑E(σˆ2)=1E(ne2) n ii=
1 =(n−2)σ2n =σ2−2σ2n 结果表明,在小样本下,σˆ2偏小,使得估计值比真实值低,是有偏的;在样本无限增大时,2→
0,从而使limE(σˆ2)=σ
2,即σˆ2是渐近无偏的。
n 2-
8.答: ⑴回归方程的截距0.7264表明,当rm为0时的股票或债券收益率,它本身没有经济意 义;回归方程的斜率1.0598表明当有价证券的收益率每上升(或下降)1个点将使股票或债券收益率上升(或下降)1.0598个点; ⑵R2为判定系数,是度量回归方程拟合优度的指标,它表明该回归方程中47.1%的股 票或债券收益率的变化是由rm的变化引起的。
当然R2=0.4710也表明回归方程对数据的 拟合效果不是很好。
⑶建立零假设H0:β1=
1,备择假设H1:β1>
1,α=0.05,n=240, 查表得临界值t0.05(238)=1.645,由于 19 t=βˆ1−1=1.0598−1=0.8214 Sβˆ 0.0728
1 故0.8214<1.645,接受零假设H0:β1=
1,拒绝备择假设H1:β1>
1。
说明此期间IBM 不是易变证券。
2-
9.证明: n ∑nY xiyi ∑αˆ=Y−βˆX=i−Xi=
1 ∑i=1n n x2 i i=
1 由于 于是 n n n n n ∑∑∑∑∑xiyi=xi(Yi−Y)=xiYi−Yxi=xiYi i=
1 i=
1 i=
1 i=
1 i=
1 ∑∑∑∑αˆ=nYi−∑∑i=1n Xn n1 xiYi=(−
X n x2i=
1 i=1n i xi)Y= n i xi2 i=
1 i=
1 (1−XWi)Yin 2-10.答: 他的论据是错误的。
原因是他忽略了随机误差项µi,这个随机误差项可取正值和负值, 但是E(µi)=
0。
另外,将Ci与Yi的关系表达为Ci=α+βYi是不准确的,它应是一个平 均关系。
2-11.证明: 设:Yˆ=αˆ+αˆ
X, i
0 1i Xˆi=βˆ0+βˆ1Yi, ∑∑则 αˆ=xiyi,βˆ=xiyi ∑∑1xi21yi2 ∑∑∑于是 αˆβˆ=(xiyi)2=R2=111xi2yi2 从而αˆ=11βˆ
1 20 2-12.证明: 由于βˆ=∑xy∑x2 ∑∑x2 y2 又Sx=n−
1,Sy=n−
1 ∑∑∑所以βˆSx=∑∑Sy x2 xy⋅ n−1= xy=r x2 y2 x2y2 n−
1 ∑∑∑∑∑∑2-13.解:由βˆ1= xyx2=β1+ xµx2=β1+ xµ/n 知: x2/n ⑴随着观测值数目的增加,根据大样本性质,参数βˆ1更接近真实值; ⑵由于Xi各观测值差额增加,意味着∑x2增加,将使得βˆ1更接近真实值;⑶如果Xi各观测值近似相等,意味着∑x2趋于零,会使得βˆ1变得很不稳定,甚至无 法计算; ⑷E(µ2)=
0,并违背随机误差项同方差的性质,所以既不会对βˆ的无偏性产生影响,
1 也不会对有效性产生影响。
2-14.解: ⑴这是一个时间序列回归(图略)。
⑵截距2.6911表示咖啡零售价在t时刻为每磅0美元时,美国平均消费量为每天每人 2.6911杯,这个数字没有明显的经济意义;斜率-0.4795表示咖啡零售价与消费量负相关, 表明咖啡价格每上升1美元,则平均每天每人消费量减少0.4795杯,即约半杯; ⑶不能;原因在于要了解全美国所有人的咖啡消费情况几乎是不可能的; ⑷不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出具体的X值及与之对应的Y值。
2-15.解: ⑴由于参数估计量β的t的绝对值为18.7,明显大于
2,故拒绝零假设H0:β=
0,从 而β在统计上是显著的; 21 ⑵参数α的估计量的标准差为15/3.1=4.84,参数β的估计量的标准差为0.81/18.7=0.043; ⑶由⑵的结果,β的95%的置信区间为: (0.81−t0.025(19−2)×0.043,0.81+t0.025(19−2)×0.043)=(0.81−0.091,0.81+0.091)=(0.719,0.901) 显然这个区间不包括
0。
2-16.解:
(1)每月家庭收入水平下,消费支出的条件均值计算见表2-
7。
表2-
7 800 550 每月 600 家庭 650 消费 700 支出 750 Y(元) 条件概率1/5条件均值650 1000650700740800850880 1/6770 1200790840900940980 1/5890 每月家庭收入X(元)1400160018002000 8001020110012009301070115013609501100120014001030116013001440108011801350145011301250140011501/71/61/61/51010113012501370 220024001350137013701450140015501520165015701750160018901620 1/71/614901610 26001500152017501780180018501910 1/71730 ⑵以收入为横轴、消费支出为纵轴作散点图如图2-3所示。
其中条件均值点显示为“°”的点,这些点近似形成一条直线(虚线表示)。
显然,X与Y之间是正向相关关系;X与Y的均值间的关系近似线性。

Y 210019001700150013001100 900700500
0 500 1000 1500 2000 2500 3000
X 22 图2-
3
(3)由于X与Y的均值间的关系呈现线性关系,可以估计总体回归函数如下。
任取两点(800,650),(2600,1730),写出总体回归方程: E(Y|X)−650=X−8001730−6502600−800 整理得 E(Y|X)=170+0.6X
(4)在Eviews软件下,容易得到样本回归函数为 Yˆ=244.6+0.5091X i i (3.81)(14.24)R2=0.9620
(5)图中同时画出了总体回归线(虚线)与样本回归线(实线),可以看出两者并不相同。
原因是存在随机误差。
2-17.解: ⑴利用所给数据作图2-
4。
160 155 150 SANDP 145 140 135 130350400450500550600650 CPI 图2-4⑵从图2-4可见,CPI指数与S&P指数正相关,且呈近似的线性关系。
⑶使用Eviews软件回归结果如下: DependentVariable:S&
P Variable Coefficient
C -1137.826 CPI 11.08361 R-squaredAdjustedR-squaredS.E.ofregressionSumsquaredresidLoglikelihoodDurbin-Watsonstat 0.9421230.93054829.614484385.086-32.472761.187041 Std.Error 177.94881.228555 t-Statistic -6.3941229.021662 MeandependentvarS.D.dependentvarAkaikeinfocriterionSchwarzcriterionF-statisticProb(F-statistic) Prob. 0.00140.0003 464.3886112.37289.8493609.83390681.390390.000279 23 回归结果显示,CPI指数与S&P指数正相关,斜率表示当CPI变化1个点,会使S&
P 变化11.08个点;截距表示当CPI为0时,S&P为-1137.8264,此数据没有明确的经济意义。
2-18.解: ⑴使用Eviews软件,ASP对GPA的回归结果如下: DependentVariable:ASP Variable Coefficient CGPA -270566.7104041.0 R-squaredAdjustedR-squaredS.E.ofregressionSumsquaredresidLoglikelihoodDurbin-Watsonstat 0.3764990.35423114615.655.98E+09-329.22871.027123 Std.Error 82444.6925302.40 t-Statistic -3.2817974.111900 MeandependentvarS.D.dependentvarAkaikeinfocriterionSchwarzcriterionF-statisticProb(F-statistic) Prob. 0.00280.0003 68260.0018187.7822.0819122.1753316.907720.000311 从回归结果看,GPA的系数是统计显著的,对ASP有正的影响。
⑵使用Eviews软件,ASP对GMAT的回归结果如下: DependentVariable:ASP Variable Coefficient CGMAT -332306.8641.6598 R-squaredAdjustedR-squaredS.E.ofregressionSumsquaredresidLoglikelihoodDurbin-Watsonstat 0.7171750.7070749843.7012.71E+09-317.37091.128809 Std.Errort-Statistic 47572.0976.15036 -6.9853328.426222 MeandependentvarS.D.dependentvarAkaikeinfocriterionSchwarzcriterionF-statisticProb(F-statistic) Prob. 0.00000.0000 68260.0018187.7821.2913921.3848071.001220.000000 从回归结果看,GMAT与ASP显著正相关。
⑶使用Eviews软件,ASP对学费(X)的回归结果如下: DependentVariable:ASP Variable Coefficient
C 23126.32
X 2.633483 R-squaredAdjustedR-squaredS.E.ofregressionSumsquaredresidLoglikelihoodDurbin-Watsonstat 0.4487480.42906113742.785.29E+09-327.38131.142178 Std.Errort-Statistic 9780.8632.3644460.5516014.774252 MeandependentvarS.D.dependentvarAkaikeinfocriterionSchwarzcriterionF-statisticProb(F-statistic) Prob. 0.02520.0001 68260.0018187.7821.9587622.0521722.793480.000051 从计算结果看,每年的学费与ASP显著正相关。
学费高,ASP就高;但学费仅解释了 ASP变化的一部分(不到50%),明显还有其他因素影响着ASP。
⑷使用Eviews软件回归结果如下: DependentVariable:GPA Variable Coefficient
C 3.147579
X 6.17E-06 Std.Error 0.0725594.09E-06 t-Statistic 43.379361.507952 Prob. 0.00000.1428 24 R-squaredAdjustedR-squaredS.E.ofregressionSumsquaredresidLoglikelihoodDurbin-Watsonstat 0.0751120.0420800.1019510.29103226.964661.702758 MeandependentvarS.D.dependentvarAkaikeinfocriterionSchwarzcriterionF-statisticProb(F-statistic) 3.2533330.104166-1.664311-1.5708972.2739200.142768 从回归结果看,尽管高学费的商业学校与高质量的MBA成绩略有正相关性,但学费对 GAP的影响是不显著的。
而且也无法得出学费是影响GAP的主要原因的结论。
2-19.解: ⑴以利率(Y)为纵轴、通胀率(X)为横轴作图2-
5。
80 60
Y 40 20
0 10 20 30 40 50
X 图2-
5
(2)Eviews软件中的OLS回归如下: DependentVariable:YVariable CX R-squaredAdjustedR-squaredS.E.ofregressionSumsquaredresidLoglikelihoodDurbin-Watsonstat Coefficient 2.6361741.250286 0.9931220.9921401.74581021.33498-16.654501.819376 Std.Error 0.6913030.039326 t-Statistic 3.81334031.79274 MeandependentvarS.D.dependentvarAkaikeinfocriterionSchwarzcriterionF-statisticProb(F-statistic) Prob. 0.00660.0000 14.5000019.691504.1454454.1892721010.7780.000000
(3)上述回归结果表明,如果实际利率不变,名义利率与通胀率呈正向关系;斜率1.2503 表明通胀率上升1个点,名义利率上升1.25个点。
25

标签: #模式 #cosco #cg #cartoon #cnn #cage #ofcourse是什么意思 #什么意思