对两个包含解释变量个数不同的回归模型进行拟合优度比较时,应比较()的大小。
第1题
利用401KSUBS.RAW中的数据。
(i)计算样本中netta的平均值、标准差、最小值和最大值。
(ii)检验假设:平均netta不会因为401(k)资格状况而有所不同,使用双侧备择假设。估计差异的美元数量是多少?
(iii)根据第7章的计算机练习C7的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e401k作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv)在第(ii)部分估计的模型中,增加交互项e401k(age-41)和e401k-(age-41)2。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi)现在,从模型中去掉交互项,但定义5个家庭规模虚拟变量:fsizel,fsize2,fsize3,fsize4和fsize5。对有5个或5个以上成员的家庭,fsize5等于1。在第(ii)部分估计的模型中,增加家庭规模虚拟变量,记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii)现在,针对模型
在容许截距不同的情况下,做5个家庭规模类别的邹至庄检验。约束残差平方和SSR,从第(iv)部分得到,因为那里回归假定了相同斜率。无约束残差平方和其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。
第2题
(i)u中包含什么样的因素?它们可能与受教育程度相关吗?
(ii)简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
第3题
第4题
利用JTRAIN.RAW,以确定工作培训津贴对每个雇员工作培训小时数的影响。三年的基本模型是:
(i)用固定效应法估计方程。在此估计中利用了多少个企业?如果每个企业都有这三年的所有变量数据(特别是hrsemp的数据),总观测个数会是多少?
(ii)解释grant的系数并评论它的显著性。
(iii)grant-1不显著有什么惊人之处吗?请解释。
(iv)平均地说,更大的企业为其职工提供了更多还是更少的培训?差别有多大?(比方说,职工多10%的企业,培训的平均小时数增多或减少了多少?)
第5题
下面哪种因素可能导致通常OLS的:统计量无效(即在H0下不服从:分布)?
(i)异方差性;
(ii)模型中两个自变量之间的样本相关系数达到0.95;
(iii)遗漏一个重要的解释变量。
第6题
假设模型满足前四个高斯-马尔科夫假定,其中,petstck表示工人养老金投资于股票市场的百分比,funds表示工人可以选择的共同基金的个数,而risktol表示对风险承受能力的某种度量(rsktol越大,则表明这个人对风险的承受能力越强)。如果funds和risktol正相关,pctstck对funds简单回归的斜率系数有怎样的不一致性?
第7题
(1)分别用两组数据建立蛋白质高、低含量对婴儿身高的回归模型,解释所得结果。
(2)怎样检验蛋白质含量的高低对婴儿的生长有无显著影响?检验结果如何?
第9题
利用数据集401KSUBS.RAW。
(i)利用OLS估计e401k的一个线性概率模型,解释变量为inc,inc²,age,age²和male。求通常的OLS标准误和异方差-稳健的标准误。它们有重要差别吗?
(iii)对第(i)部分估计的模型求怀特检验,并分析系数估计值是否大致对应于第(ii)部分中描述的理论值。
(iv)在验证了第(i)部分的拟合值都介于0和1之间后,求这个线性概率模型的加权最小二乘估计值。它们与OLS估计值有重大差别吗?
第11题
利用得自格雷迪(Graddy,1995)的数据集FISH.RAW。这个数据集也曾用于第12章的计算机练习C9.现在,我们用它估计一个鱼肉需求函数。
(i)假定每个时期均衡的鱼肉需求方程可写成
所以容许需求在一周中的每一天都有所不同。把价格变量视为内生的,一致地估计需求方程参数还需要什么额外信息?
(ii)变量wavet和wave3t度量了过去几天的海浪高度。为了在估计需求方程时将wave2t和wave3t用作log(avgprc)的Ⅳ,我们还需要哪两个假定?
(ii)将log(avgprc)对周工作日虚拟变量和两个浪高指标进行回归。wave2t和wave3t联合显著吗?这个检验的p值是多少?
(iv)现在,用2SLS估计需求方程。需求价格弹性的95%置信区间是什么?所估计的弹性合理吗?
(v)求2SLS的残差ut。在用2SLS估计需求方程时增加一个滞后ut-1记住,用ut-1作为自己的工具。需求方程误差中有AR(1)序列相关的证据吗?
(vi)给定供给方程明显取决于海浪变量,为了估计供给价格弹性,我们需要哪两个假定?
(vii)在log(avgprct)的约简型方程中,周工作日虚拟变量联合显著吗?你对能够估计供给弹性有何结论?