答案:答:相关分析与回归分析有密切的关系,它们都是对变量间相关关系的研究,二者可以相互 补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在一上程度的相关 关系时,进行回归分析才有实际的意义。同时,在进行相关分析时如果要具体确左变量间相 关的具体数学形式,又要依赖于回归分析,而且相关分析中相关系数的确左也是建立在回归 分析基础上的。相关分析与回归分析的区别。从研究目的上看,相关分析是用一立的数量指标(相关系 数)度疑变量间相互联系的方向和程度:回归分析却是要寻求变量间联系的具体数学形式, 是要根据解释变量的固左值去估汁和预测被解释变呈的平均值。从对变量的处理看,相关分 析对称地对待相互联系的变量,不考虑二者的因果关系,也就是不区分解释变量和被解释变 量,相关的变量不一泄具有因果关系,均视为随机变量:回归分析是建立在变量因果关系分 析的基础上,研究英中解释变量的变动对被解释变量的具体影响,回归分析中必须明确划分 解释变疑和被解释变量,对变量的处理是不对称的。什么是总体回归函数和样本回归函数它们之间的区别是什么 答:总体回归函数是将总体被解释变量的条件期望表现为解释变量的函数。样本回归函数是 将被解释变量的样本条件均值表示为解释变量的函数。总体回归函数和样本回归函数之间的区别。首先,总体回归函数虽然未知,但它是确泄 的:而由于从总体中每次抽样都能获得一个样本,就都可以拟合一条样本回归线,样本回归 线是随抽样波动而变化的,可以有很多条。所以样本回归函数还不是总体回归函数,至多只 是未知的总体回归函数的近似反映。其次,总体回归函数的参数是确定的常数:而样本回归 函数的参数是随抽样而变化的随机变量。什么是随机扰动项和剩余项(残差)它们之间的区别是什么答:总体回归函数中,被解释变量个别值z与条件期望£(y|xj的偏差是随机扰动项冷。样本回归函数中,被解释变量个别值x与样本条件均值£的偏差是残差项耳。残差项耳在 概念上类似总体回归函数中的随机扰动项①,可视为对随机扰动项%的估讣。总体回归函数中的随机误差项是不可以直接观测的;而样本回归函数中的残差项是只要 估计出样本回归的参数就可以计算的数值。为什么在对参数作最小二乘估计之前,要对模型提出古典假设 答:在对参数作最小二乘估计之前,要对模型提出古典假设。因为模型中有随机扰动,估计 的参数是随机变量,只有对随机扰动的分布作出假左,才能确定所估计参数的分布性质,也 才可能进行假设检验和区间估计。只有具备一赵的假泄条件,所作出的估计才具有较好的统 计性质。总体方差和参数估计方差的区别是什么答:总体方差是未知的,但是确定存在的。参数估计方差可以由样本数据计算岀来,但只是 总体的近似反映,未必等于真实值。为什么可决系数可以度量模型的拟合优度在简单线性回归中它与对参数的t检验的关系是 什么答:可决系数是回归平方和占总离差平方和的比重,即由样本回归作出解释的离差平方和在 总离差平方和中占的比重,如果样本回归线对样本观测值拟合程度好,各样本观测点与回归 线靠得越近,由样本回归作出解释的离差平方和在总离差平方和中占的比重也将越大,反之 拟合程度越差,这部分所占比重就越小。所以可决系数可以作为综合度量回归模型对样本观 测值拟合优度的指标。在简单线性回归中,可决系数越大,说明在总变差中由模型作出了解释的部分占的比重 越大,X对Y的解释能力越强,模型拟合优度越好。对参数的t检验是判断解释变量X是否 是被解释变量Y的显著影响因素。二者的目的作用是一致的。有人说:“得到参数区间估计的上下限后,说明参数的真实值落入这个区间的概率为1一&。” 如何评论这种说法答:这种说法是错误的。区间是随机的,只是说明在重复抽样中,像这样的区间可构造许多 次,从长远看平均地说,这些区间中将有1-a的概率包含着参数的真实值。参数的真实值 虽然未知,却是一个固左的值,不是随机变量。所以应理解为区间包含参数貞•实值的概率是 1 —a,而不能认为参数的真实值落入这个区间的概率为1 —a。■对参数假设检验的基本思想是什么答:对参数假设检验的基本思想,是在所估计样本回归系数概率分布性质已确泄的基础上, 在对总体回归系数某种原假设成立的条件下,利用适当的有明确概率分布的统汁量和给泄的 显著性水平a,构造一个小概率事件,判断原假设结果合理与否,是基于“小概率事件不 易发生”的原理,可以认为小概率事件在一次观察中基本不会发生,如果小概率事件竟然发 生了,就认为原假设不成立,从而拒绝原假设,不拒绝备择假设。为什么对被解释变量个别值的预测区间会比对被解释变量平均值的预测区间更宽答:预测被解释变量平均值仅存在抽样误差,而对被解释变呈:个别值的预测,不仅存在抽样 误差,而且要受随机扰动项的影响。所以对个别值的预测区间比对平均值的预测区间更宽。 如果有人利用中国1978〜2000年的样本估计的il•量经济模型直接预测“中国综合经济水平 将在2050年达到美国2002年的水平”,你如何评论这种预测答:用回归模型作预测时,预测期解释变就取值不宜偏离样本期过远,否则预测的精度会大 大降低。利用中国1978〜2000年的样本估计50年之后的经济水平,英预测不会太准确。对本章开始提岀的“中国旅游业总收入将超过3000亿美元”,你认为可以建立什么样的简单 线性回归模型去分析答:对本章开始提出的问题,我们会考虑:是什么决泄性的因素能使中国旅游业总收入到 2020年达到3000亿美元旅游业的发展与这种决泄性因素的数疑关系究竟是什么怎样具体测 左旅游业发展与这种决左性因素的数量关系综合考虑各种因素,我们认为影响中国旅游业总 收入的决泄性因素是中国居民收入的增长。于是建立如下模型:Y=a ^X u⏺其中,Y为中国旅游业总收入,X为中国居民收入。