spss 卡方检验,Logistic回归方法「建议收藏」

spss 卡方检验,Logistic回归方法「建议收藏」案例:新生儿体重较低影响因素1:影响因素分析,求出哪些自变量对因变量发生概率有影响,并计算各自变量对因变量的比数比;2:作为判别分析方法,来估计各种自变量组合条件下因变量各类别的发生概率,从而对结局进行预测,该模型在结果上等价于判别分析;说明:低出生体重标准:新生儿体重<2500克结果变量为是否娩出低出生体重儿,变量名为low,1=低出生体重,0=非低出生体重;考虑的影响因素…

大家好,又见面了,我是你们的朋友全栈君。

每天进步一点点

案例:新生儿体重较低影响因素
1:影响因素分析,求出哪些自变量对因变量发生概率有影响,并计算各自变量对因变量的比数比;
2:作为判别分析方法,来估计各种自变量组合条件下因变量各类别的发生概率,从而对结局进行预测,该模型在结果上等价于判别分析;

说明:低出生体重标准:新生儿体重<2500克
结果变量为是否娩出低出生体重儿,变量名为low,1 = 低出生体重,0 =非低出生体重;
考虑的影响因素,即自变量如下:
1:产妇妊娠前体重(lwt,磅)
2:产妇年龄(age,岁)
3:产妇在妊娠期间是否抽烟(smoke,0=未吸,1=吸烟)
4:本次妊娠前早产次数(plt,次)
5:是否患有高血压(ht,0=未患,1=患病)
6:子宫对按摩,催产素等刺激引起收缩的应激性(ui,0=无,1=有)
7:妊娠前三个月社区一声随访次数(ftv,次)
8:种族(race,1=白人,2=黑人,3=其他民族)

数据源请至“我的资源” 自行下载~~~,需要1积分哦~

如果只研究“是否吸烟”对于新生儿体重的影响,那么可以使用卡方检验

卡方检验 如下:

分析—描述统计—交叉表—统计—卡方—确定
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

从检验结果来看,显著性检验小于0.05,说明产妇妊娠期是否抽烟,对新生儿出生体重较低还是有影响的;
由于自变量太多,卡方检验并不合适,下面我们试一下Logistic回归方法
Logistic回归涉及到的检验
1:walds检验(变量筛选):基于标准误估计值的单变量检验,不考虑其他因素的综合作用,当因素之间存在共线性时结果不可靠,所以在筛选变量时,此方法要慎重
2:思然比检验(模型比较):直接对两个模型进行的比较,适用于模型较为复杂时,两个模型-2对数似然值之差即为似然比统计量,自由度亦为两个模型参数个数之差;
3:比分检验:考虑在已有模型基础上引入新变量之后模型效果是否发生改变;

下面开始建模: 分析—回归—二元Logistic
在这里插入图片描述
先只看逻辑回归只研究“是否吸烟”对新生儿体重的影响:

在这里插入图片描述
新生儿体重:low,1 = 低出生体重,0 =非低出生体
内部值是1,即研究自变量对这个变量的影响,如果是0,得出的结果正负值相反;

在这里插入图片描述
块0:
起始块,只有常数项模型,也叫基线模型或无效模型;
分类表:模型预测的情况,分界值为0.5,预测模型全部预测成正常体重,预测率高达68.6%,很明显,这个预测是错误的;
方程中的变量:显著性<0.05,证明常数项不为0;
不在方程中的变量(比分检验):把smoke这个变量纳入模型没有效果,显著性<0.05证明纳入进来还是有效果的;

spss 卡方检验,Logistic回归方法「建议收藏」
块1:
模型系数的omnibus综合检验:变量的纳入模型与不纳入模型是否有区别,显著性<0.05 说明有区别,卡方说明变量的加入下降了多少似然比统计量;
模型摘要(似然比检验): -2对数似然值衡量的是模型对数据的解释程度,模型的价值指标,越接近0越好,单独看没意义,要和其他模型比较才有价值;
**分类表:**查看模型预测结果及切分点;
**方程中的变量(walds检验):**显著性 变量纳入模型对模型效果是否显著,Exp(B)称比数比,其他自变量取值保持不变时,该自变量取值增加一个单位,引起比数比(OR) 自然对数值的变化量,当概率比较低的时候,可以理解概率会上升为原来的几倍;
在这里插入图片描述
刚才只考虑低体重新生儿与是否吸烟的回归关系,现在把所有的二分类自变量和连续类型自变量放进去建模:
分析—回归—二元Logistic

在这里插入图片描述
结果解读:
块0
起始块一般没有变化,不在方程中的变量 这个表格有区别,总统计显著性<0.05,证明把所有模型都纳入进来是有意义的,然后再去细看每一个自变量;
在这里插入图片描述
块1:
方程中的变量::显著性>0.05的几个变量是不显著的,如果直接剔除,walds检验不考虑其他因素的综合作用,当因素之间存在共线性时,结果不可靠,所以在筛选变量时,walds法要慎重
我们应选用比分检验和似然检验来挑选模型
在这里插入图片描述
总结以上:比较来说,最靠谱的是LR(似然比检验)或 比分检验,而Walds检验使用则需慎重。
LR(似然比检验)比较好,这里的向前是指逐步法,向后是指向后法;

选择:向前 LR
在这里插入图片描述

结果解读:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
最终只选择变量 lwt,ptl,ht时,模型比数比为217.22;

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/145833.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号