最小二乘法详细推导过程

最小二乘法详细推导过程转载自:http://blog.csdn.net/marsjohn/article/details/54911788在数据的统计分析中,数据之间即变量x与Y之间的相关性研究非常重要,通过在直角坐标系中做散点图的方式我们会发现很多统计数据近似一条直线,它们之间或者正相关或者负相关。虽然这些数据是离散的,不是连续的,我们无法得到一个确定的描述这种相关性的函数方程,但既然在直角坐标系中数据分布接近一…

大家好,又见面了,我是你们的朋友全栈君。

转载自:http://blog.csdn.net/marsjohn/article/details/54911788

在数据的统计分析中,数据之间即变量x与Y之间的相关性研究非常重要,通过在直角坐标系中做散点图的方式我们会发现很多统计数据近似一条直线,它们之间或者正相关或者负相关。虽然这些数据是离散的,不是连续的,我们无法得到一个确定的描述这种相关性的函数方程,但既然在直角坐标系中数据分布接近一条直线,那么我们就可以通过画直线的方式得到一个近似的描述这种关系的直线方程。当然,从前面的描述中不难看出,所有数据都分布在一条直线附近,因此这样的直线可以画出很多条,而我们希望找出其中的一条,能够最好地反映变量之间的关系。换言之,我们要找出一条直线,使这条直线“最贴近”已知的数据点,设此直线方程为:
最小二乘法详细推导过程

这里的最小二乘法详细推导过程是为了区分Y的实际值y(这里的实际值就是统计数据的真实值,我们称之为观察值),当x取值最小二乘法详细推导过程(i=1,2,3……n)时,Y的观察值为最小二乘法详细推导过程,近似值为最小二乘法详细推导过程(或者说对应最小二乘法详细推导过程的纵坐标是最小二乘法详细推导过程)。

其中最小二乘法详细推导过程式叫做Y对x的回归直线方程,b叫做回归系数。要想确定回归直线方程最小二乘法详细推导过程,我们只需确定a与回归系数b即可。

 设x,Y的一组观察值为:
最小二乘法详细推导过程   i = 1,2,3……n

其回归直线方程为:
最小二乘法详细推导过程

当x取值最小二乘法详细推导过程(i=1,2,3……n)时,Y的观察值为最小二乘法详细推导过程,差最小二乘法详细推导过程刻画了实际观察值最小二乘法详细推导过程与回归直线上相应点纵坐标之间的偏离程度,见下图:
最小二乘法详细推导过程

 实际上我们希望这n个离差构成的总离差越小越好,只有如此才能使直线最贴近已知点。换句话说,我们求回归直线方程的过程其实就是求离差最小值的过程。

一个很自然的想法是把各个离差加起来作为总离差。可是,由于离差有正有负,直接相加会互相抵消,如此就无法反映这些数据的贴近程度,即这个总离差不能用n个离差之和来表示,见下图:
最小二乘法详细推导过程
 
一般做法是我们用离差的平方和,即:
最小二乘法详细推导过程

作为总离差 ,并使之达到最小。这样回归直线就是所有直线中Q取最小值的那一条。由于平方又叫二乘方,所以这种使“离差平方和为最小”的方法,叫做最小二乘法
用最小二乘法求回归直线方程中的a、b的公式如下:
最小二乘法详细推导过程

其中,最小二乘法详细推导过程最小二乘法详细推导过程最小二乘法详细推导过程最小二乘法详细推导过程的均值,a、b的上方加“︿”表示是由观察值按最小二乘法求得的估计值,a、b求出后,回归直线方程也就建立起来了。

当然,我们肯定不能满足于直接得到公式,我们只有理解这个公式怎么来的才能记住它,用好它,因此给出上面两个公式的推导过程更加重要。在给出上述公式的推导过程之前,我们先给出推导过程中用到的两个关键变形公式的推导过程。首先是第一个公式:
 最小二乘法详细推导过程
 

接着是第二个公式:
最小二乘法详细推导过程
 
 基本变形公式准备完毕,我们可以开始最小二乘法求回归直线方程公式的推导了:
最小二乘法详细推导过程
最小二乘法详细推导过程
 
 至此,公式变形部分结束,从最终式子我们可以看到后两项
最小二乘法详细推导过程

与a、b无关,属于常数项,我们只需
最小二乘法详细推导过程

即可得到最小的Q值,因此:
最小二乘法详细推导过程

至此,公式推导完毕。
 

最小二乘法求回归直线方程可用于所有数据分布近似直线的数据统计、分析问题,其用程序实现非常简便,属于基础统计分析算法,必须能够熟练掌握应用。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/145253.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 7.4v升12v锂电池升压芯片方案_电池升压

    7.4v升12v锂电池升压芯片方案_电池升压HU5912是一款5V输入,支持四节锂电池的升压充电管理IC。HU5912,采用异步开关架构,使其在应用时仅需要极少的外围器件,可有效减少整体方案尺寸,降低BOM成本。HU5912的升压开关充电转换器的工作效率为90%。HU5912输入电压为5V,内置自适应环路,可智能调节充电电流,防止拉挂适配器的输出,可匹配所有适配器。描述20W,4A输入异步开关升压充电升压充电效率90%充电电流外部可调自动调节输入电流,匹配所有适配器支持LED充电状态指示内置功率MO

  • Java程序概述

    Java程序概述Java程序概述一、Java开发环境1、Java程序编译执行的过程2、Java平台概述3、JDK部分常用工具二、Application三、Applet四、Servlet五、JSP和JavaBean六、脚本一、Java开发环境1、Java程序编译执行的过程Java程序在编译执行过程中,首先把源文件(.java文件)编译成字节码文件,即类文件(.class);然后由解释器负责解释执行类文件。2、Java平台概述Java平台包括Java应用程序接口(API)和Java虚拟机(JavaVirtual

  • 函数声明[通俗易懂]

    函数声明[通俗易懂]语法描述通过函数声明构造的函数是Function对象,所以拥有一切Function对象所有的属性,方法和行为。函数默认返回undefined,如果想返回其他值,函数必须使用return语句来返回

  • samba服务共享目录时 什么参数表示该共享目录可以浏览_电脑samba共享

    samba服务共享目录时 什么参数表示该共享目录可以浏览_电脑samba共享会不会有那么一天,生活可以简单到每天清早踏上一辆载着鲜花的脚踏车,微笑着穿过窄窄的街巷,为爱花的人送去芬芳,为需要知识的你送去帮助。上期为大家说了如何搭建dhcp服务(详情点击使用DHCP动态分配IP)本期为大家带来搭建samba服务先来说说samba服务的作用:跨平台支持文件共享服务samba的特点:支持匿名和身份验证共享数据,它的安全性也比较高samba支持的协议有:nmb(监听137,138号端口,提供域名访问,属于UDP协议)smb(监听139号端口,服务消息块,提供Linux平台共享

  • jQuery 模板 tmpl 用法「建议收藏」

    jQuery 模板 tmpl 用法「建议收藏」昨晚无意中发现一个有趣的jQuery插件.tmpl(),其文档在这里。官方解释对该插件的说明:将匹配的第一个元素作为模板,render指定的数据,签名如下:.tmpl([data,][options])其中参数data的用途很明显:用于render的数据,可以是任意js类型,包括数组和对象。options一般情况下都是

  • 电商数仓(dwd 层)

    电商数仓(dwd 层)一、dwd层介绍1、对用户行为数据解析。2、对核心数据进行判空过滤。3、对业务数据采用维度模型重新建模,即维度退化。二、dwd层用户行为数据2.1用户行为启动表dwd_start_log1、数据来源ods_start_log->dwd_start_log2、表的创建droptableifexistsdwd_start_log;CREATEEXTER…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号