多重共线性的问题
佟叔婵
60
使用统计软件时,发现回归模型中自变量多重共线性高,导致方差膨胀因子(VIF)超过5。这就是坑,别信模型结果,重新选择或处理变量。
华伯衍
4
多重共线性在数据分析中是个大坑,2023年我处理过好几个项目,数据集里变量高度相关,导致模型不稳定,预测准确率低得可怜。直接后果就是模型无法投入实际应用。得,花时间降维,特征选择,搞了小半年才搞定。
丙孟方
299
多重共线性这个问题,我最近在学数据分析的时候遇到过的。2023年我在上海某商场的一家数据可视化公司实习,当时我们团队在做一个市场分析的项目。
那天,我们正在处理一大堆数据,准备用线性回归模型来预测销售额。结果,我们发现数据里的变量之间关系太复杂了,好多变量之间都有很强的相关性。这就是多重共线性了。
我当时挺头大的,因为多重共线性会让回归模型的系数估计变得不稳定,预测结果也不可靠。我们团队花了好几天时间,尝试了各种方法来解决,比如剔除一些相关性很强的变量,或者使用岭回归、LASSO回归这类方法来降低共线性的影响。
这个过程挺曲折的,有时候感觉像是在迷宫里转圈。不过,最后还是把问题解决了。反正你看着办,如果你也遇到类似的问题,可以试试这些方法。我还在想这个问题,可能还有其他更好的解决方案呢。
相关标签: 问题