概率中的PDF,PMF,CDF

概率中的PDF,PMF,CDF一概念解释二数学表示三概念分析四分布函数的意义五参考文献一.概念解释PDF:概率密度函数(probabilitydensityfunction),在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。PMF:概率质量函数(probabilitymassfunction),在概率

大家好,又见面了,我是你们的朋友全栈君。

一. 概念解释

  1. PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

  2. PMF : 概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。

  3. CDF : 累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。

二. 数学表示

  1. PDF:如果 X 是连续型随机变量,定义概率密度函数为 fX(x) ,用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率,即


    Pr(aXb)=bafX(x)dx

  2. PMF:如果 X 离散型随机变量,定义概率质量函数为 fX(x) ,PMF其实就是高中所学的离散型随机变量的分布律,即


    fX(x)=Pr(X=x)

    比如对于掷一枚均匀硬币,如果正面令 X=1 ,如果反面令 X=0 ,那么它的PMF就是


    fX(x)={
    12 if x{
    0,1}
    0 if x{
    0,1}

  3. CDF:不管是什么类型(连续/离散/其他)的随机变量,都可以定义它的累积分布函数,有时简称为分布函数。

    对于连续型随机变量,显然有 FX(x)=Pr(Xx)=xfX(t)dt 那么CDF就是PDF的积分,PDF就是CDF的导数。

    对于离散型随机变量,其CDF是分段函数,比如举例中的掷硬币随机变量,它的CDF为


    FX(x)=Pr(Xx)=0 if x<012 if 0x<11 if x1

三.概念分析

 根据上述,我们能得到一下结论:

 1)PDF是连续变量特有的,PMF是离散随机变量特有的;
 2)PDF的取值本身不是概率,它是一种趋势(密度)只有对连续随机变量的取值进行积分后才是概率,也就是说对于连续值确定它在某一点的概率是没有意义的;
 3)PMF的取值本身代表该值的概率。

四.分布函数的意义

  我们从两点来分析分布函数的意义:
  
  1.为什么需要分布函数?

  对于离散型随机变量,可以直接用分布律来描述其统计规律性,而对于非离散型的随机变量,如连续型随机变量,因为我们无法一一列举出随机变量的所有可能取值,所以它的概率分布不能像随机变量那样进行描述,于是引入PDF,用积分来求随机变量落入某个区间的概率。分布律不能描述连续型随机变量,密度函数不能描述离散随机变量,因此需要找到一个统一方式描述随机变量统计规律,这就有了分布函数。另外,在现实生活中,有时候人们感兴趣的是随机变量落入某个范围内的概率是多少,如掷骰子的数小于3点的获胜,那么考虑随机变量落入某个区间的概率就变得有现实意义了,因此引入分布函数很有必要。

  2. 分布函数的意义

  分布函数 F(x) 在点 x 处的函数值表示

X
落在区间 (,x] 内的概率,所以分布函数就是定义域为 R <script type="math/tex" id="MathJax-Element-19">R</script>的一个普通函数,因此我们可以把概率问题转化为函数问题,从而可以利用普通的函数知识来研究概率问题,增大了概率的研究范围。

五.参考文献

  http://www.dataguru.cn/thread-150756-1-1.html
  https://www.zhihu.com/question/23022012
  https://www.zhihu.com/question/36853661
  https://www.zhihu.com/question/21911186
  http://wenku.baidu.com/view/823a0bb9f111f18582d05a14.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/142430.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 自动加密web.config配置节批处理

    自动加密web.config配置节批处理

  • Java:遍历数组的三种方法[通俗易懂]

    Java:遍历数组的三种方法[通俗易懂]1、for循环遍历数组用for循环遍历数组是很常见的一种方法,Java语言中通过数组的length属性可获得数组的长度。packagedemo;publicclasstest{ publicstaticvoidmain(String[]args){ int[]array={1,2,3,4,5}; for(inti=0;i<array.length;i++){ System.out.print(array[i]+””); } }

  • 基于 mysql时序_时序数据库简介

    基于 mysql时序_时序数据库简介时间序列数据库简称时序数据库(TimeSeriesDatabase),用于处理带时间标签(按照时间的顺序变化,即时间序列化)的数据,带时间标签的数据也称为时间序列数据。时序数据的几个特点1.基本上都是插入,没有更新的需求。2.数据基本上都有时间属性,随着时间的推移不断产生新的数据。3.数据量大,每秒钟需要写入成千万上亿条数据业务方常见需求1.获取最新状态,查询最近的数据(例如传感器最新…

  • pycharm许可证过期_当前系统license过期

    pycharm许可证过期_当前系统license过期问题描述今天打开PyCharm的时候弹出提示框Yourlicensehasexpired,表示证书到期了,无法继续使用软件。之前使用的证书是在学校的时候注册的学生账号,也就是以.edu.cn结尾的账号。现在需要寻找一种新的认证方式。解决方案PyCharm属于JetBrains的一员,这个系列的软件的认证方式有三种,分别是账号登录、激活码和授权服务器。对于在校的学生用户,…

  • Python之json文件

    json简介json是一种轻量级的数据交换格式完全独立于编程语言的文本格式来存储和表示数据简单和清晰的层次结构使得json成为理想的数据交换语言。易于阅读和编写,易于机器解析和生成,并有效地提升

    2021年12月19日
  • laravel 中使用tinker注入数据到数据库

    laravel 中使用tinker注入数据到数据库

    2021年10月24日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号