假设我们想估计若干个变量对年储蓄的影响,并且我们拥有1990年1月31日和1992年1月31日所收集的
利用SLEEP75.RAW中的数据
变量sleep是每周晚上睡眠的总分钟数,totwork是每周花在工作上的总分钟数,educ和age则以年为单位,而male是一个性别虚拟变量。
(i)所有其他因素不变,有没有男性比女性睡眠更多的证据?这个证据有多强?
(ii)工作与睡眠之间有统计显著的取舍关系吗?所估计的取舍关系是什么样的?
(iii)为了检验年龄在其他因素不变的情况下对睡眠没有影响这个原假设,你还需要另外做什么回归?
假设你对估计大学一年级每周花在学习上的小时数(study)对平均成绩(gpa)的影响感兴趣。
(i)在这样的上下文中需要一个什么样的控制实验?这样的实验看起来是否可行?
(ii)考虑一个更加实际的情形,即由学生选择每周在学习上花多少时间,而你只能随机地从总体中抽出gpa和study两个变量(在一年的学习结束后)。将总体模型写作如下形式:gpa=β0+β1study+u。其中,与通常带截距的模型一样,我们可以假设E(u)=0。列举至少两个u中包含的因素。这些因素是否与study成正相关或负相关?
(iii)如果上一问的等式中的因果关系成立,那么在(ii)的方程中,β1的符号应该是正还是负?
(iv)在(ii)的方程中,β0该如何解释?
占销售额的百分比。
利用RDCHEM.RAW中32家化工企业的数据,估计如下方程:
(i)解释log(sales)的系数。特别地,如果sales增加10%,估计rdntens会变化多少个百分点?这在经济上是一个很大的影响吗?
(ii)检验假设R&D的强度不随sales而变化,对立假设是,它随着销售额的增加而提高。在5%和10%的显著性水平上进行这个检验。
(iii)解释profmarg的系数,它在经济上显著吗?
(iv)profmarg对rdintens是否有统计显著的影响?
(i) 如果你利用一个容量为n的随机样本进行score。对voucheri的简单回归, 那么, 普通最小二乘估计量能给出教育券项目影响的一个无偏估计量吗?
(ii)假设你还可以搜集到一些诸如家庭收入、家庭结构(比如孩子是否与双亲住在一起)和父母的受教育水平等背景信息。为了得到教育券项目影响的无偏估计量,你需要控制这些因素吗?请解释。
(iii)你为什么应该在回归中包含这些家庭背景变量?有没有你不包含这些背景变量的情况呢?
利用FERTIL2.RAW中的数据。解释存活儿童数的一个简单模型是:
其中,解释变量是女性接受教育的年限,年龄(以年表示)及分别表示女性家是否有电和电视机的二元变量。
(i)用OLS估计该方程并用通常的形式报告结果。讨论变量eletric和tv的系数和统计显著性。
(ii)城市居民和非城市居民在生育率上有区别吗?请解释。
(ii)现在对城市居民和非城市居民分别估计方程(当然,解释变量要去掉urban)。除了截距以外,其他系数有明显区别吗?
(iV)允许城市居民和非城市居民截距项不同,在原假设下得到邹至庄统计量。你能得到什么结论?[提示:你在检验5个限制条件,SSR从第(ii)部分和第(iii)部分中很容易得到。]
其中,因为滞后支出变量,第一个可用年份(基年)是1993年。
(i)用混合OLS估计模型, 并报告通常的标准误。为使得ai的期望值可以非零, 你应该与年度虚拟变量一起包含一个截距项。支出变量的估计效应是什么?求OLS残差。
(ii)lunchit系数的符号在意料之中吗?解释系数的大小。你认为学区的贫穷率对考试通过率有很大的影响吗?
(iii)利用的回归计算AR(1)序列相关的一个检验。你应该在回归中使用1994~1998年的数据。验证存在很强的正序列相关,并讨论为什么。
(iv)现在用固定效应法估计方程。滞后的支出变量仍显著吗?
(v)你为什么认为在固定效应估计中,注册学生人数和午餐项目变量不是联合显著的?
其中pop是城市人口,avginc是平均收入,而petstu是学生人口占城市人口的百分数(按学年计算)。
(i)用混合OLS估计方程并按标准方式报告结果。你如何理解1990年虚拟变量的估计值?你得到βpctstu是多少?
(ii)你在第(i)部分中报告的标准误是否真实?请解释。
(iii)现在,将方程差分并用OLS估计。把你对βpctstu的估计值和第(ii)部分进行比较。学生人口的相对规模对房租有影响吗?
(iv)对第(ii)部分中的一阶差分方程求异方差-稳健的标准误。这是否改变了你的结论?
利用DISCRIM.RAW中的数据回答本题。(也可参见第3章计算机练习C8。)
(i)利用OLS估计模型
以常用形式报告结果。在5%的显著性水平上,相对一个双侧备择假设,β统计显著异于零吗?在1%的显著性水平上呢?
(ii)log(income)和prppov的相关系数是多少?每个变量都是统计显著的吗?报告双侧P值。
(iii)在第(i)部分的回归中增加变量log(hseval)。解释其系数并报告的双侧p值。
(iv)在第(ii)部分的回归中,log(income)和prppov的个别统计显著性有何变化?这些变量联合显著吗?(计算一个p值。)你如何解释你的答案?
(v)给定前面的回归结果,在确定一个地区的种族构成是否影响当地快餐价格时,你会报告哪一个结果才最为可靠?