多重共线性的解决办法-哈哈智教

多重共线性的解决办法

多重共线性 VIF 3396 阅读
秘仲伯
秘仲伯

多重共线性直接剔除相关变量。 2021年某项目,数据集剔除3个变量,模型误差从10%降到7%。

诸仲密
诸仲密

使用方差膨胀因子(VIF)检测,VIF > 5 则考虑剔除变量。

杞伯青
杞伯青

记得有一次,我在一个项目里,数据集里竟然出现了多重共线性问题。那是一个下午,我在分析一组气象数据,突然发现模型的R²值虽然很高,但预测结果却总是跳来跳去,像过山车一样。我仔细检查了数据,发现温度、湿度、风速这些变量竟然有高达0.9以上的相关性。
当时我就头疼了,多重共线性会让模型不稳定,预测结果不可靠。我尝试了多种方法,像是逐步回归、主成分分析(PCA),甚至还有个事,我突然想到可以试试岭回归。结果,用岭回归处理后的模型,R²值虽然略有下降,但预测结果稳定多了,预测误差从原来的5%降低到了2%。
等等,还有个事,我突然想到,如果数据集里的变量真的太多了,是不是可以考虑缩减变量呢?于是我又用方差膨胀因子(VIF)筛选掉了几个相关性较高的变量,结果模型更好用了。
但说到底,多重共线性是个复杂的问题,没有一劳永逸的解决办法。那你们觉得,还有哪些方法可以解决多重共线性呢?

相关标签: 多重共线性

相关推荐

逢魔时王漫威小说

英语学习软件哪个好

公平和正义的区别图

情结是什么意思

分等级的名称

大宋皇朝多少年

考虑用英语怎么说词组

心理罪主角叫什么

十大公认仙侠小说神作

社会环境评估包括