逻辑回归算法原理_人工智能回归算法

逻辑回归算法原理_人工智能回归算法http://ihoge.cn/2018/LR.html逻辑回归模型逻辑回归也被称为对数几率回归,算法名虽然叫做逻辑回归,但是该算法是分类算法,个人认为这是因为逻辑回归用了和回归类似的方法来解决了分类问题。逻辑回归模型是一种分类模型,用条件概率分布的形式表示P(Y|X)P(Y|X)P(Y|X),这里随机变量X取值为n维实数向量,例如x=(x(1),x(2),…,x(n))…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

http://ihoge.cn/2018/LR.html

逻辑回归模型

逻辑回归也被称为对数几率回归,算法名虽然叫做逻辑回归,但是该算法是分类算法,个人认为这是因为逻辑回归用了和回归类似的方法来解决了分类问题。

逻辑回归模型是一种分类模型,用条件概率分布的形式表示 P(Y|X) P ( Y | X ) ,这里随机变量 X 取值为 n 维实数向量,例如 x=(x(1),x(2),...,x(n)) x = ( x ( 1 ) , x ( 2 ) , . . . , x ( n ) ) ,Y 取值为 0 或 1。即:

P(Y=1|x)=exp(wx+b)1+exp(wx+b) P ( Y = 1 | x ) = exp ⁡ ( w ⋅ x + b ) 1 + exp ⁡ ( w ⋅ x + b )

P(Y=0|0)=11+exp(wx+b) P ( Y = 0 | 0 ) = 1 1 + exp ⁡ ( w ⋅ x + b )

或:

ϕ(x)=11+ewTxb ϕ ( x ) = 1 1 + e − w T x − b

假设有一个二分类问题,输出为 y{
0,1}
y ∈ { 0 , 1 }
,二线性回归模型 z=wTx+b z = w T x + b 是个实数值,我们希望有一个理想的阶跃函数来帮我什么实现z值到0/1值的转化,于是找到了Sigmoid函数来代替:

g(z)=11+ez g ( z ) = 1 1 + e − z




逻辑回归算法原理_人工智能回归算法

有了 Sigmoid 函数之后,由于其值取值范围在[0,1]。就可以将其视为类 1 的后验概率估计 p(y=1|X) p ( y = 1 | X ) 。说白了,就是如果有了一个测试点 x,那么就可以用Sigmoid函数算出来的结果当作该点 x 属于类别 1 的概率大小。

于是,非常自然地,我们把 Sigmoid 函数计算得到的值大于等于0.5的归为类别1,小于0.5的归为类别0:

逻辑函数的损失函数

接下来要做的就是根据给定的训练集,把参数 w 给求出来了。要找参数 w,首先就得把代价函数(Cost Function)给定义出来,也就是目标函数。

我们第一个想到的自然是模仿线性回归的做法,利用误差平方和来当代价函数:

J(θ)=12mi=0m(ϕ(xi)yi)2 J ( θ ) = 1 2 m ∑ i = 0 m ( ϕ ( x i ) − y i ) 2



这时将预测函数

g(z(i))=11+ex(i) g ( z ( i ) ) = 1 1 + e − x ( i )
代入损失函数的话,会发现这是一个非凸函数,这意味着代价函数有着许多的局部最小值,这不利于我们求解:

逻辑回归算法原理_人工智能回归算法
那么我们不妨来换一个思路解决这个问题。前面,我们提到了 ϕ(z) 可以视为类1的后验估计,所以我们有:
逻辑回归算法原理_人工智能回归算法
其中 p(y=1|x;w) p ( y = 1 | x ; w ) 表示给定 w,那么 x 点 y=1 的概率大小。于是上面两式可以写成一般形式:
逻辑回归算法原理_人工智能回归算法

注:以上的过程说明,最大似然估计与误差平方和等价!这就是为什么逻辑回归的损失函数可以用最大似然函数进行估计的原因。

接下来我们就要用极大似然估计来根据给定的训练集估计出参数 w:
逻辑回归算法原理_人工智能回归算法
为了简化运算,我们对上面这个等式的两边都取一个对数:
逻辑回归算法原理_人工智能回归算法
我们现在要求的是使得 l(w) 最大的 w。没错,我们的代价函数出现了,我们在 l(w) 前面加个负号不就变成就最小了吗?不就变成我们代价函数了吗?
逻辑回归算法原理_人工智能回归算法
为了更好地理解这个代价函数,我们不妨拿一个例子的来看看:
逻辑回归算法原理_人工智能回归算法
也就是说:
逻辑回归算法原理_人工智能回归算法
下面是函数图:
逻辑回归算法原理_人工智能回归算法
从图中不难看出,如果样本的值是1的话,估计值 ϕ(z) 越接近1付出的代价就越小,反之越大;同理,如果样本的值是0的话,估计值 ϕ(z) 越接近0付出的代价就越小,反之越大。

逻辑回归的模型求解

在开始梯度下降之前,要这里插一句,Sigmoid function 有一个很好的性质就是 :

ϕ(z)=ϕ(z)(1ϕ(z)) ϕ ′ ( z ) = ϕ ( z ) ( 1 − ϕ ( z ) )



这个后续会用到。

还有,我们要明确一点,梯度的负方向就是代价函数下降最快的方向:这里来解释下。借助泰勒公式展开,有:
逻辑回归算法原理_人工智能回归算法
其中,f′(x) 和 δ 为向量,那么这两者的内积就等于:
逻辑回归算法原理_人工智能回归算法
当 θ=π 时,也就是 δ 在 f′(x) 的负方向上时,取得最小值,也就是下降的最快的方向了。
于是有:
逻辑回归算法原理_人工智能回归算法
即:
逻辑回归算法原理_人工智能回归算法
其中, wj w j 表示第 j 个特征的权重;η 为学习率,用来控制步长。 重点来了:
逻辑回归算法原理_人工智能回归算法
所以,在使用梯度下降法更新权重时,只要根据下式即可:
逻辑回归算法原理_人工智能回归算法
此式与线性回归时更新权重用的式子极为相似,也许这也是逻辑回归要在后面加上回归两个字的原因吧。当然,在样本量极大的时候,每次更新权重会非常耗费时间,这时可以采用随机梯度下降法,这时每次迭代时需要将样本重新打乱,然后用下式不断更新权重:
逻辑回归算法原理_人工智能回归算法
也就是去掉了求和,而是针对每个样本点都进行更新。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/171772.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • 阿里云之自动化构建方案

    阿里云之自动化构建方案

    2020年11月19日
  • windows安装wget命令_linux安装命令install

    windows安装wget命令_linux安装命令install今天给服务器安装新LNMP环境时,wget时提示-bash:wgetcommandnotfound,很明显没有安装wget软件包。一般linux最小化安装时,wget不会默认被安装。可以通过以下两种方法来安装:1、rpm安装rpm下载源地址:http://mirrors.163.com/centos/6.2/os/x86_64/Packages/下载wget的RPM包:htt…

  • python自动补全设置_python自动缩进快捷键

    python自动补全设置_python自动缩进快捷键Hello,大家好,我是橘子呀~前几期橘子给大家介绍了Python是什么以及如何安装Python软件。也分享了如何系统的以及高效率的去学习Python这门课程,还有一些避雷建议,今天橘子就分享给大伙一点宝藏干货!!!藏不住的东西,不如扬了它!请大家把它收入囊中~不要辜负我的一片苦心~一、Pycharm常用快捷键(Windows)Ctrl+Q快速查看文档Ctrl+鼠标左键简介及代码定义…

  • web后端语言_C/C++作为web后端语言的缺点

    web后端语言_C/C++作为web后端语言的缺点C/C++C语言虽然是非常贴近操作系统的语言,能和操作系统API很好的交互,但是C语言并没有现代化工程开发所需要的面向对象功能,当然也缺乏泛型之类的功能,如果以CGI的形式开发,那么缺点非常明显,这也是第二代后端平台兴起的原因。C++具有现代化工程开发所需要的各种功能,但是它同样有缺点:缺乏字符串处理,Web开发最主要的就是字符串的处理,所有的一切几乎都要和字符串打交道,但是C…

  • mysql如何批量添加数据_mysql如何批量insert数据

    mysql如何批量添加数据_mysql如何批量insert数据mysql批量insert数据的方法:1、循环插入;2、减少连接资源,拼接一条sql;3、使用存储过程;4、使用【MYSQLLOCAL_INFILE】。本教程操作环境:windows7系统、mysql8.0.22版,该方法适用于所有品牌电脑。mysql批量insert数据的方法:方法一:循环插入这个也是最普通的方式,如果数据量不是很大,可以使用,但是每次都要消耗连接数据库的资源。大致思维如下(我…

    2022年10月23日
  • eigen库基本使用方法_mkl库

    eigen库基本使用方法_mkl库Eigen帮助C++实现了对矩阵的非常方便的操作。本文旨在总结常用的矩阵处理对应的代码。

    2022年10月19日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号