多重共线性:python计算VIF以及使用vif做因子独立性检验的方法「建议收藏」

多重共线性:python计算VIF以及使用vif做因子独立性检验的方法「建议收藏」转自:https://blog.csdn.net/ab1112221212/article/details/100133066多重共线性在python中的解决方法本文将讨论多重共线性的相关概念及利用python自动化消除多重共线性的方法,以供参考,欢迎拍砖线性模型与非线性模型关于线性模型与非线性模型的定义,似乎并没有确切的定论,但是个人认为建模首先得清楚地认识样本,样本有线性可分与线性不可分两种,所谓是否线性可分,是指是否存在一条直线(或平面)将样本分开。上图中y=0和y=1的样本可以由一

大家好,又见面了,我是你们的朋友全栈君。

参考:https://www.zhihu.com/question/270451437/answer/405814593

https://www.cnpython.com/qa/38203

import numpy as np
import scipy as sp

a = [1, 1, 2, 3, 4]
b = [2, 2, 3, 2, 1]
c = [4, 6, 7, 8, 9]
d = [4, 3, 4, 5, 4]

ck = np.column_stack([a, b, c, d])
cc = sp.corrcoef(ck, rowvar=False)
VIF = np.linalg.inv(cc)
VIF.diagonal()

 

from statsmodels.stats.outliers_influence import variance_inflation_factor
from statsmodels.tools.tools import add_constant

df = pd.DataFrame(
    {'a': [1, 1, 2, 3, 4],
     'b': [2, 2, 3, 2, 1],
     'c': [4, 6, 7, 8, 9],
     'd': [4, 3, 4, 5, 4]}
)

X = add_constant(df)
>>> pd.Series([variance_inflation_factor(X.values, i) 
               for i in range(X.shape[1])], 
              index=X.columns)

 

参考:https://zhuanlan.zhihu.com/p/56468729

       使用VIF进行检验的方法主要为,对某一因子和其余因子进行回归,得到R^2,计算VIF,剔除因子中VIF高的因子,保留VIF较低的因子,以此类推,直到得到一个相关性较低的因子组合来增强模型的解释能力。

  在实际测试过程中,并非要指定一个VIF阈值,比如某因子的VIF值超过阈值才剔除,而是通过观察所有因子值的VIF值,如果发现该值较大(显著离群),剔除该因子即可。本次我们的几个因子表现都非常出色,VIF值稳定且没有离群较大值,因此,没能找到任何一个需要剔除的因子。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/135202.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • eclipse设置系统字体

    eclipse设置系统字体

  • C# 简单封装一个XML文件读取类

    C# 简单封装一个XML文件读取类

  • 英特尔处理器性能排行2021_intel芯片组天梯图

    英特尔处理器性能排行2021_intel芯片组天梯图用于企业服务站和工作站的电脑硬件要求会比较高,常用的处理器可能会用到英特尔至强xeonCPU处理器。而至强xeon系列的型号有很多,不同的型号的性能也有差异,那么至强cpu哪些比较好呢?下面小编就给大家分享下英特尔2021至强cpu性能排行天梯图,供大家参考。2021至强cpu性能排行天梯图前100名情况如下:(图片来源于网络)以上便是英特尔2021至强cpu性能排行天梯图前100名cpu的情况,大家可以根据自己的需求选择合适的cpu处理器即可。更多有用的系统知识和重.

  • man jps「建议收藏」

    man jps「建议收藏」manjpsjps(1)                                                                                                             jps(1)Name      jps-JavaVirtualMachineProcessStatusTool

  • vue与jquery的区别_vue 3

    vue与jquery的区别_vue 31.jquery介绍:想必大家都用过jquery吧,这个曾经也是现在依然最流行的web前端js库,可是现在无论是国内还是国外他的使用率正在渐渐被其他的js库所代替,随着浏览器厂商对HTML5规范统一遵循以及ECMA6在浏览器端的实现,jquery的使用率将会越来越低2.vue介绍:vue是一个兴起的前端js库,是一个精简的MVVM。从技术角度讲,Vue.js专注于MVVM模型的ViewM…

    2022年10月16日
  • BeanUtils.populate 使用笔记

    BeanUtils.populate 使用笔记最近在学习网站开发,在后端获取网站请求数据的时候用到了BeanUtils.populate()方法,具体用法是:BeanUtils.populate(objectobj,Map<String,String[]>map);于是我就在想这个方法是怎么把map中的数据封装到obj对象里的。打开源码看,看别人写的代码是真难受,看了半天还是没看懂。上网搜了一下,发现多数都是在讲用法…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号