python多因素方差分析_双因素方差分析例题

python多因素方差分析_双因素方差分析例题在实际应用中,一个实验的指标往往受到多个因素的影响。例如饮料的销量有可能受到销售地区或者饮料颜色的影响。在方差分析中,若把饮料的颜色看做影响销量的因素A,把销售地区看做影响因素B。同时对因素A和因素B进行分析,就称为双因素方差分析。a b ca1 b1 20a1 b2 22a1 b3 24a1 b4 16a1 b5 26a2 b1 12a2 b2 10a2 b3 14a2 b…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

在实际应用中,一个实验的指标往往受到多个因素的影响。

例如饮料的销量有可能受到销售地区或者饮料颜色的影响。在方差分析中,若把饮料的颜色看做影响销量的因素A,把销售地区看做影响因素B。同时对因素A和因素B进行分析,就称为双因素方差分析。

a	b	c
a1	b1	20
a1	b2	22
a1	b3	24
a1	b4	16
a1	b5	26
a2	b1	12
a2	b2	10
a2	b3	14
a2	b4	4
a2	b5	22
a3	b1	20
a3	b2	20
a3	b3	18
a3	b4	8
a3	b5	16
a4	b1	10
a4	b2	12
a4	b3	18
a4	b4	6
a4	b5	20
a5	b1	14
a5	b2	6
a5	b3	10
a5	b4	18
a5	b5	10

from statsmodels.formula.api import ols from statsmodels.stats.anova import anova_lm formula = 'c~ a + b ' anova_results = anova_lm(ols(formula,df).fit()) print(anova_results) 
            df  sum_sq  mean_sq         F    PR(>F)
a          4.0  335.36    83.84  3.874307  0.021886
b          4.0  199.36    49.84  2.303142  0.103195
Residual  16.0  346.24    21.64       NaN       NaN

检验的结论:

因素A的p值0.021886<0.05,拒绝原假设,说明饮料颜色对销量有显著影响;而因素B的p值0.103195>0.05,不能拒绝原假设,因此没有充分的理由说明销售地区对销量有显著影响。

然而,我们知道了颜色对销量有显著影响,那么是哪种颜色呢?
使用tukey方法对颜色进行多重比较

from statsmodels.stats.multicomp import pairwise_tukeyhsd print(pairwise_tukeyhsd(df['c'], df['a'])) 
Multiple Comparison of Means - Tukey HSD,FWER=0.05
==============================================
group1 group2 meandiff  lower    upper  reject
----------------------------------------------
  1      2      -9.2   -19.0855  0.6855 False 
  1      3      -5.2   -15.0855  4.6855 False 
  1      4      -8.4   -18.2855  1.4855 False 
  1      5     -10.0   -19.8855 -0.1145  True 
  2      3      4.0    -5.8855  13.8855 False 
  2      4      0.8    -9.0855  10.6855 False 
  2      5      -0.8   -10.6855  9.0855 False 
  3      4      -3.2   -13.0855  6.6855 False 
  3      5      -4.8   -14.6855  5.0855 False 
  4      5      -1.6   -11.4855  8.2855 False 
----------------------------------------------

结果说明:1和5的reject=True,说明这两种颜色有显著性差异

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/184737.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • kafka的使用场景举例_kafka一般用来做什么

    kafka的使用场景举例_kafka一般用来做什么关于消息队列的使用一、消息队列概述消息队列中间件是分布式系统中重要的组件,主要解决应用解耦,异步消息,流量削锋等问题,实现高性能,高可用,可伸缩和最终一致性架构。目前使用较多的消息队列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ二、消息队列应用场景以下介绍消息队列在实际应用中常用的使用场景。异步处理,应用解耦,流量削锋和消息通讯四个场景。2.1异步…

    2022年10月15日
  • void *指针赋值「建议收藏」

    p1 = p2;或p1 = (void *) p2; void指针可以指向任意类型的数据,亦即可用任意数据类型的指针对void指针赋值。例如:int * pint;void *pvoid;pvoid = pint; /* 不过不能 pint= pvoid; */如果要将pvoid赋给其他类型指针,则需要强制类型转换如:pint= (i

  • 堆排序算法(图解详细流程)

    堆排序算法(图解详细流程)堆排序的时间复杂度O(N*logN),额外空间复杂度O(1),是一个不稳定性的排序目录一准备知识1.1大根堆和小根堆二堆排序基本步骤2.1构造堆2.2固定最大值再构造堆三总结四代码一准备知识堆的结构可以分为大根堆和小根堆,是一个完全二叉树,而堆排序是根据堆的这种数据结构设计的一种排序,下面先来看看什么是大根堆和小根堆1.1大根…

  • typescript 接口_接口是什么

    typescript 接口_接口是什么介绍TypeScript的核心原则之一是对值所具有的结构进行类型检查。我们使用接口(Interfaces)来定义对象的类型。接口是对象的状态(属性)和行为(方法)的抽象(描述)接口初探声明接口

  • 彻底弄懂C语言数组名

    彻底弄懂C语言数组名先定义一个一维数组inta[]={0,1,2,3,4,5,6,7,8,9};一、数组名是什么数组名的值是数组首元素的指针常量。数组名不是指针,但大多数使用到数组名的地方,编译器都会把数组名隐式转换成一个指向数组首元素的指针来处理。只有两种情况下例外:第一种是对数组名使用sizeof运算符sizeof(a)这将会得到整个数组所占的内存大小,a是长度为10的int(4字节

  • python读取图像的几种方法

    python读取图像的几种方法方法一:利用PIL中的Image函数,这个函数读取出来不是array格式这时候需要用np.asarray(im)或者np.array()函数区别是np.array()是深拷贝,np.asarray()是浅拷贝fromPILimportImageimportnumpyasnpI=Image.open(‘./cc_1.png’)I.show()

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号