最小二乘法原理和推导过程「建议收藏」

最小二乘法原理和推导过程「建议收藏」对于有误差的统计值,我们一般都是采用均值作为使用值。但是这种使用均值代替的方式是不是合理?为什么不用中位数、几何平均数什么的?这需要一个解释。1.什么是二乘?对于一列数字,比如10.1、…

大家好,又见面了,我是你们的朋友全栈君。

对于有误差的统计值,我们一般都是采用均值作为使用值。但是这种使用均值代替的方式是不是合理?为什么不用中位数、几何平均数什么的?这需要一个解释。

1.什么是二乘?

对于一列数字,比如10.1、10.3、9.7、9.9、10.5来说,我们要采用一个数字Y来替代他们。要求是这些数与Y的差异要达到最小。在数学上就是:

最小二乘法原理和推导过程「建议收藏」

但是数学上对于求绝对值比较排斥,一般直接采用求平方代替。也就是二乘的来源

最小二乘法原理和推导过程「建议收藏」

        那么我们要计划使用的值Y就是关于e的一元函数,也就是说不同的Y,对我们的e都有影响,而我们要想e最小,就让Y的偏导数为0,也就是:

最小二乘法原理和推导过程「建议收藏」

    得到Y为:

最小二乘法原理和推导过程「建议收藏」

这样是说最小二乘法得到Y值就是平均数;

2.最小二乘的推广

通过上边的分析,我们可以得出最小二乘法的数学表达式的推广模式:

最小二乘法原理和推导过程「建议收藏」

其中fx是待探索的期望函数,yi表示真实数据。要是函数e最小,则让e对fx的偏导数等于0,如果fx为一个多元函数,那么将其带入。然后分步求导,并让其在各个变量上的偏导数为0,然后得出fx的真实表达式。

3.对于一般线性方程的二乘法学习

我们假设要探索的函数方程为:

最小二乘法原理和推导过程「建议收藏」

那么:

最小二乘法原理和推导过程「建议收藏」

要使得e的值达到最小,已知x和yi,对于k和b来说采用不同的值,e的值会有不同的变化,那么我们使用e对k和b分别求偏导数。

最小二乘法原理和推导过程「建议收藏」

最小二乘法原理和推导过程「建议收藏」

然后计算一下(痛苦的过程,别问我怎么知道使用求和性质的,我是百度的,我也不知道这个东西);

最小二乘法原理和推导过程「建议收藏」

从另外一个角度思考,对于很多数据来说他们肯定落在一个区域内。通过上述分析,最小二乘法能够得出这些点的误差最小点。那么这些点与这个标志点的距离就可以形成一种分布概率密度函数(曲面),那么曲面的顶点对应的映射点按理就是这个标志点。也就是说概率密度函数在该点的偏导数为0,伟大的数学家高斯通过计算证明了这一点,从而奠定了最小二乘法的权威地位。

最小二乘法原理和推导过程「建议收藏」

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/145525.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • oracle查询约束条件[通俗易懂]

    oracle查询约束条件[通俗易懂]查找约束的方法如下:(1)查找某表上的约束select*fromuser_constraintswheretable_name=‘MEDIA’(2)查找到约束所在的表SELECT*FROMUSER_CONSTRAINTSWHERECONSTRAINT_NAME=‘PK_MEDIA’;可能需要DBA权限。2.定义UNINQU…

    2022年10月13日
  • Mysql 导出数据到Excel

    Mysql 导出数据到Excel

  • python实现excel转json的例子[通俗易懂]

    python实现excel转json的例子[通俗易懂]python实现excel转json的例子(改进版)由于数值策划给出数值是excel表格,但前台flash程序用的又是json格式。服务器也用了json格式,而json又是utf-8编码的,用C++实现,太痛苦。鉴于此,尝试用python实现看看。没想到,python实现确实很简单,一个多小时搞定(有搜索事半功倍啊)。今天我又对它做了一点改进。主要1、是支持float和多表格;2、在exc…

  • mysql数据库总结体会(mysql的发展历史简介)

    一、数据库简介数据库(Database,DB)是按照数据结构来组织,存储和管理数据的仓库。典型特征:数据的结构化、数据间的共享、减少数据的冗余度,数据的独立性。关系型数据库:使用关系模型把数据组织到数据表(table)中。现实世界可以用数据来描述。主流的关系型数据库产品:Oracle(Oracle)、DB2(IBM)、SQLServer(MS)、MySQL(Oracle)。数据表:数…

  • 图像分割之分水岭算法[通俗易懂]

    图像分割之分水岭算法[通俗易懂]使用C++、opencv进行分水岭分割图像分水岭概念是以对图像进行三维可视化处理为基础的:其中两个是坐标,另一个是灰度级。基于“地形学”的这种解释,我们考虑三类点:a.属于局部性最小值的点,也可能存在一个最小值面,该平面内的都是最小值点b.当一滴水放在某点的位置上的时候,水一定会下落到一个单一的最小值点c.当水处在某个点的位置上时,水会等概率地流向不止一个这样的最小值点对一个特…

  • 关于ActionContext.getContext()的使用方法心得

    关于ActionContext.getContext()的使用方法心得

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号