多重共线性(Multicollinearity)是指
线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。
多重共线性使参数估计值的
方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF)
需要注意:即使出现较高程度的多重共线性,OLS
估计量仍具有线性性等良好的统计性质。但是OLS法在统计推断上无法给出真正有用的信息。
判断方法2:条件
索引列第3第4列大于10,可以说明存在比较严重的共线性。
判断方法3:比例
方差内存在接近1的数(0.99),可以说明存在较严重的共线性。
(3)减小参数
估计量的方差:岭回归法(Ridge Regression)。