利用BARIUM.RAW中的数据。
(i)用前119次观测(即不包含1988年的最后12个月观测),估计线性趋势模型。这个回归的标准误是什么?
(ii)同样用除了最后12个月以外的所有数据,估计chnimp的一个AR(1)模型。把这个回归的标准误与第(i)部分中的标准误相比较。哪一个模型提供了更好的样本内拟合?
(iii)用第(i)和第(ii)部分中的模型计算1988年12个月的提前一期预测误差。(每个方法都应该得到12个预测误差。)计算并比较这两种方法的RMSE和MAE。就样本外提前一期预测而言,哪种方法效果更好?
(iv)在第(i)部分的回归中添加月度虚拟变量。它们是联合显著的吗?(当我们检验联合显著性时,不必担心误差中轻度的序列相关。)
(i)描述估计的滞后分布。gwage的哪一个滞后对gprice的影响最大?哪一个滞后的系数最小?
(ii)哪些滞后的:统计量小于2?
(iii)估计的长期倾向是多少?它与1有很大不同吗?解释本例中的LRP告诉了我们什么?
(iv)你将用什么样的模型来直接求出LRP的标准误?
(v)你将怎样检验gwage的6阶以上滞后的联合显著性?F分布的df是多少?(注意:你又失去了6个观测。)
使用VOTE1.RAW中的数据。
(i)估计一个以voteA为因变量并以prystrA、deocA、log(expendA)和log(expendB)为自变量的模型。得到OLS残差,并将这些残差对所有的自变量进行回归。解释你为什么得到R2=0。
(ii)现在计算异方差性的布罗施-帕甘检验。使用F统计量的形式并报告P值。
(iii)同样利用F统计量形式计算异方差性的特殊怀特检验。现在异方差性的证据有多强?
A、拟合优度R2的取值范围是-1≤R2≤1
B、回归的残差平方和占总离差平方和的比重越大,说明拟和的效果越好
C、拟合优度R2越接近1,说明拟合的效果越好
D、t检验是用来检验方程整体的显著性的
使用PNTSPRD.RAW中的数据。
(i)变量sprdcvr是一个二值变量,若在大学篮球比赛中实际分数差距超过拉斯维加斯让分,则此变量取值1。sprdcvr的期望值(比方说u)表示在一场随机抽取的比赛中分差超过让分的概率。在10%的显著性水平上相对于H1:μ≠0.5检验H0:μ=0.5,并讨论你的结果。(提示:将sprdcvr只对一个截距项进行回归便得到一个r统计量,利用这个统计量很容易完成。)
(ii)553个样本中有多少场比赛是在中立场地进行的?
(iii)估计线性概率模型
并以通常的形式报告结论。(报告通常的标准误和异方差-稳健的标准误。)哪个变量在实际上和统计上都是最显著的?
(iv)解释为什么在原假设下,模型中不存在异方差性。
(v)利用通常的F统计量检验第(iv)部分的原假设,你得到了什么结论?
(vi)给定上述分析,你会不会认为,利用赛前可利用的信息,有可能系统地预测拉斯维加斯让分能否实现?
下列关于回归模型的说法,正确的是()。
A.一元线性回归模型是用于分析一个自变量X与一个因变量Y之间线性关系的数学方程
B.判定系数r2表明指标变量之间的依存程度,r2越大,表明依存度越大
C.在一元线性回归分析中,b的t检验和模型整体的F检验二者取其一即可
D.在多元回归分析中,b的t检验和模型整体的F检验是不等价的
本题利用401KSUBS.RAW中的数据。
(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。
(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同, 使用双侧对立假设。估计差异的美元数量是多少?
(iii)根据计算机习题C7.9的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv) 在第(iii) 部分估计的模型中, 增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi) 现在, 从模型中去掉交互项, 但定义5个家庭规模虚拟变量:fsize l, j size2,f size 3, f size 4和f size 5。对有5个或5个以上成员的家庭, fsize 5等于1。在第(iii) 部分估计的模型中, 增加家庭规模虚拟变量, 记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii) 现在, 针对模型
在容许截距不同的情况下, 做5个家庭规模类别的邹至庄检验。约束残差平方和SSR, 从第(vi) 部分得到,因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 , 其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。
下列关于回归模型的说法,正确的是()。
A.一元线性圆归模型是用于分析一个自变量X与一个因变量Y之间线性关系的数学方程
B.判定系数r2表明指标变量之间的依存程度,r2越大,表明依存度越大
C.在一元线性回归分析中,b的t检验和模型整体的F检验二者取其一即可
D.在多元回归分析中,b的t检验和模型整体的F检验是不等价的