集中趋势中均值、中位数、众数以及偏态分布、偏度和峰度计算相关

集中趋势中均值、中位数、众数以及偏态分布、偏度和峰度计算相关均值、中位数、中位数的概念以及优缺点对比。偏态分布难点分析,以及偏度、峰度计算公式。文末附相关学习链接。

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

在这里插入图片描述

1 案例:计算出下面数据中的均值、众数、中位数

超市一天收款账单的金额分别为:

​ 21,100,30,25,26,27,26,10

均值:33.125

众数:26

中位数:26

计算有限个数的数据的中位数的方法是:把所有的同类数据按照大小的顺序排列。 如果数据的个数是奇数,则中间那个数据就是这群数据的中位数;如果数据的个数是偶数,则中间那2个数据的算术平均值就是这群数据的中位数。

2 均值、众数、中位数对比

2.1 均值

  • 优点:充分利用所有数据,适用性强

  • 缺点:容易受到极端值的影响【上面例子中的100就可以理解为极端值,在数据处理中这类值需要注意,可能是异常值】

2.2 中位数

  • 优点:不受极端值影响

  • 缺点:缺乏敏感性【只关注中间的数字】

2.3 众数

  • 优点:代表性好
  • 缺点:缺乏唯一性【有时可能存在多个众数】

3 偏态

3.1 概率密度函数

这里加入概率密度函数相关概念有利于理解下面的偏态分布。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xybpgW33-1628410834044)(集中趋势中均值、中位数、众数的分析与对比.assets/image-20210808155551812.png)]

3.2 偏态分布

在这里插入图片描述

偏态分布为统计学概念,即统计数据峰值与平均值不相等的频率分布。根据峰值小于或大于平均值可分为正偏函数和负偏函数,其偏离的程度可用偏态系数刻画.

左偏分布也被称为负偏态,右偏分布也会称为正偏态。

用均值、中位数、众数三者的位置关系判定和查看

  • 中位数查看

    • 将数据一分为二(中位数的位置),哪边数据少,就是往哪边偏。
  • 众数描述

    • 众数位置哪边尾巴长,就是往哪边偏。
  • 数据分布往哪边偏,均值被拉往哪边

偏度本身是相对于均值左右数据的多少。这里拿右偏分布举例,也就是说数据在均值左侧的数量较多,**所以为了达到所有数据于均值之差和为0,应该存在较大的数与之平衡,所有分布图里有一个很长的右端的拖尾(就是右端必须存在很大的值)。既然均值左侧的数比较多,对比中位数左右两侧数一样多,则均值必在中位数的右侧(即这样围成面积才大于0.5)。**另外,右偏的图像围成面积为0.5的分界点应该在峰值点的右侧,所以中位数大于众数。所以就有众小于中小于均。

作者:雪绒花与蚊子
链接:https://www.jianshu.com/p/a558a3f4b84a
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

3.3 偏度计算

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JxhSNr5S-1628410834048)(集中趋势中均值、中位数、众数的分析与对比.assets/image-20210808161836183.png)]

3.3 峰度

peakedness;kurtosis)又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了峰部的尖度。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CVMRiGOL-1628410834050)(集中趋势中均值、中位数、众数的分析与对比.assets/image-20210808161711066.png)]

计算:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0xEMWrhW-1628410834053)(集中趋势中均值、中位数、众数的分析与对比.assets/890640-20180501222450299-1166771113.png)]

峰度定义为四阶标准矩,可以看出来和上面偏度的定义非常的像,只不过前者是三阶的。

相关链接:

1左偏和右偏 – 简书

2偏态 – 搜索结果 – 知乎 (zhihu.com)

3 概率统计-方差与正态分布(高斯分布)_Hello_Ray的博客-CSDN博客_正态分布方差

4 一文搞懂“正态分布”所有需要的知识点 – 知乎 (zhihu.com)

5 偏度和峰度的计算 – 小舔哥 – 博客园 (cnblogs.com)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/192754.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号