其中pop是城市人口,avginc是平均收入,而petstu是学生人口占城市人口的百分数(按学年计算)。
(i)用混合OLS估计方程并按标准方式报告结果。你如何理解1990年虚拟变量的估计值?你得到βpctstu是多少?
(ii)你在第(i)部分中报告的标准误是否真实?请解释。
(iii)现在,将方程差分并用OLS估计。把你对βpctstu的估计值和第(ii)部分进行比较。学生人口的相对规模对房租有影响吗?
(iv)对第(ii)部分中的一阶差分方程求异方差-稳健的标准误。这是否改变了你的结论?
利用BARIUM.RAW中的数据。
(i)用前119次观测(即不包含1988年的最后12个月观测),估计线性趋势模型。这个回归的标准误是什么?
(ii)同样用除了最后12个月以外的所有数据,估计chnimp的一个AR(1)模型。把这个回归的标准误与第(i)部分中的标准误相比较。哪一个模型提供了更好的样本内拟合?
(iii)用第(i)和第(ii)部分中的模型计算1988年12个月的提前一期预测误差。(每个方法都应该得到12个预测误差。)计算并比较这两种方法的RMSE和MAE。就样本外提前一期预测而言,哪种方法效果更好?
(iv)在第(i)部分的回归中添加月度虚拟变量。它们是联合显著的吗?(当我们检验联合显著性时,不必担心误差中轻度的序列相关。)
本题使用CARD.RAW中的数据。
(i)我们在例15.4中所估计的方程可写成:
其中其他解释变量在表15.1中列出。为使Ⅳ具有一致性, e chic的IV, 即near c 4, 必须与u不相关。near c 4是否会与误差项内的因素相关,例如无法观测的能力?请解释。
(ii)对于数据集中的男性子样木, 可以利用IQ分数。做IQ对near c 4的回归以验证平均IQ分数是否因该男子在四年制大学附近长大而改变。你将得出什么结论?
(iii)现在,将IQ对near c4、sms a 66及1966年地域性虚拟变量re9662, …, re 9669进行回归。排除了地理上的虚拟变量之后, 10是否与near c 4有关?如何使该答案与你在第(ii) 部分中发现的结果相符合。
(iv)从第(ii)和(iii)部分中, 对于在log(wage) 方程中控制sms a 66和1966年地域性虚拟变量的重要性,你将得出什么结论?
本题要用到TRAFFIC2.RAW中的数据。加州1981年至1989年交通事故的这些月度观测在第10章计算机习题11中曾被使用过。
(i)利用标准的迪基-富勒回归, 检验Itotacc, 是否具有单位根。在2.5%的显著性水平上, 你能拒绝单位根的存在吗?
(ii)现在,在第(i)部分的检验中增加两个滞后变化,并计算增广迪基-富勒检验。你得到什么结论?
(iii)在第(ii) 部分的ADF回归中增加一个线性时间趋势变量。现在情况又将如何?
(iv)根据第(i) 部分至第(ii) 部分的结论, 你认为对I to tacc, 的最好刻画是:一个Ⅰ(1)过程还是一个含有线性时间趋势的Ⅰ(O)过程?
(v)在一个ADF回归中, 利用两个滞后项来检验致死交通事故百分数pre fat是否存在单位根。在此情形中,包含一个线性时间趋势与否是否有关系?
其中,PRICEl表示门票价格(可能以真实价格度量,比如通过地区消费者价格指数进行平减),WINPERCl表示球队当前获胜的概率,RIVALl表示一个标志着比赛是否势均力敌的虚拟变量,而WEEKEND表示一个标志着球赛是否在周末进行的虚拟变量。I表示自然对数,所以这个需求函数具有常价格弹性。
(i)为什么在这个方程中有一个时间趋势是个好想法?
(ii)门票供给由体育馆的容量所固定;假定这个供给10年不变。这意味着供给的数量不随价格而变化。这意味着价格在这个需求方程中必然是外生变量吗?(提示:回答是否定的。)
(iii)假设门票的名义价格缓慢变化(如在每个赛季之初)。体育委员会部分基于上赛季的平均售票和该队上赛季的胜率来选择价格。在什么样的条件下,上个赛季的胜率(SEASt-1)是IPRICEt一个有效的工具变量?
(iv)在方程中包括男子篮球比赛的真实价格(的对数)看起来合理吗?请解释。经济理论预测其系数的符号是什么样的?你能想到另外一个与男子篮球相关而又属于女子观众方程的变量吗?
(v)如果你担心某些序列(特别是IATTEND和IPRICE)有单位根,你如何改变所估计的方程?
(vi)如果某些比赛的门票售空,这会导致估计需求方程出现什么问题?(提示:如果门票售空,你一定观察到真实需求了吗?)
(i)用混合OLS估计一个以学期GPA(trmgpa)为因变量的模型。解释变量是sprng,sat,hsperc,feale,black,white,frestsem,tothrs,crsgpa和season。试解释season的系数。它统计显著吗?
(ii)在仅参与秋季运动项目的运动员中,大多数是足球运动员。假定足球运动员的能力水平和其他运动员的能力水平有系统差异。如果SAT分数和中学成绩百分位数不能很好地反映一个人的能力水平,那么混合OLS估计量将是有偏误的。试解释。
(iii)现在,取两个学期数据的差分,问哪些变量将随之消失?现在检验赛季效应。
(iv)你能想象一个或多个有潜在重要性而又不随时间而变化的变量,在此分析中被我们忽略了吗?
你是否同意以下命题?并对你的判断给出简要说明。
(i)像横截面观测一样,我们可以假定大多数时间序列观测是独立分布的。
(ii)时间序列回归中的OLS估计量在前三个高斯-马尔科夫假定下是无偏的。
(iii)在多元回归中,一个含有趋势的变量不能用作因变量。
(iv)在使用年度时间序列观测时,不存在季节性问题。
本题利用TRAFFIC 2.RAW中的数据。前面的计算机习题C 10.11曾要求你分析这些数据。
(i)计算变量prc fat的一阶自相关系数。你认为prc fat包含单位根吗?失业率也一样吗?
(ii)估计一个将prc fal的一阶差分Aprcfat与计算机习题C10.11第(vi) 部分中同样变量相联系的多元回归模型,只是你还应该对失业率进行一阶差分。于是,模型中包含一个线性时间趋势、月度虚拟变量、周末变量和两个政策变量:不要将这些变量进行差分。你发现了什么有意思的结论吗?
(iii)评论如下命题:“在进行多元回归之前,我们总应该将怀疑具有单位根的时间序列进行一阶差分,因为这样做是一种安全策略,而且应该得到与使用水平值类似的结论。”[在回答这个问题时,最好先做(如果你还没有做过的话)计算机习题C10.11第(vi)部分中的回归。]
A.有了相互比较,教师才有动力
B.领导要求教师,相互之间要对比数据
C.只有数据对比后,才能发现异常数据
D.数据只有对比,才能展先数据的价值
利用TWOYEAR.RAW中的数据。
(i)变量stotal是一项标准化测试变量,可用作无法观测的能力的代理变量。求stotal的样本均值和标准差。
(ii)做警察和univ对stotal的简单回归。两个大学教育变量都与stotal统计相关吗?请解释。
(iii)在教材方程(4.17)中增加stotal,并检验二年制大专和四年制大学教育具有相同回报的假设,备择假设是四年制大学的回报更高。你的结论与4.4节中的结论有何区别?
(iv)在第(iii)部分估计的方程中增加stotal2。测试分数变量的二次项有必要吗?
(v)在第(iii)部分的方程中增加stotal·警察和stotal·univ。这两项联合显著吗?
(vi)你通过使用stotal而控制能力变量的最终模型是什么?说明你的理由。