softmax损失函数理解「建议收藏」

softmax损失函数理解「建议收藏」softmaxsoftmax的定义假设有一个数组V,ViVi表示V中的第i个元素,那么这个元素的softmax值为:SoftmaxLayer和SoftmaxLossLayersoftmaxLayersoftmax实际上就是logistic的扩展,后者只能二分类,前者则能多分类,实际上都是返回每一类的概率值。在caffe里面softmax的实现分为以下几步(加入输入到softmax里面…

大家好,又见面了,我是你们的朋友全栈君。

softmax
softmax的定义
在这里插入图片描述
假设有一个数组V,ViVi表示V中的第i个元素,那么这个元素的softmax值为:
在这里插入图片描述
SoftmaxLayer和SoftmaxLossLayer

softmaxLayer
softmax实际上就是logistic的扩展,后者只能二分类,前者则能多分类,实际上都是返回每一类的概率值。在caffe里面softmax的实现分为以下几步(加入输入到softmax里面的结点数为10):
1)找出输入的最大值,输入的每个变量减去最大值,取指数(e为底);
2)对1)中结果归一化,得出的结果就是每一类的分类概率。

softmaxLoss
实际上就是个代价函数,我们要让分类正确的概率最大,然后我们对这个概率取log对数,由于代价函数都是最小化,所以我们在log前面加个负号。caffe中都是以batch为单位进行训练的,所以计算loss的时候都是以batch为单位求和取平均。

softmax loss是我们最熟悉的loss之一了,分类任务中使用它,分割任务中依然使用它。softmax loss实际上是由softmax和cross-entropy loss组合而成,两者放一起数值计算更加稳定。这里我们将其数学推导一起回顾一遍。

令z是softmax层的输入,f(z)是softmax的输出,则

单个像素i的softmax loss等于cross-entropy error如下:

展开上式:

softmaxLoss
在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/153117.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 数据库系统概论第五版 课后习题答案王珊

    数据库系统概论第五版 课后习题答案王珊第1章绪论1.试述数据、数据库、数据库系统、数据库管理系统的概念。答:(l)数据(Data):描述事物的符号记录称为数据。数据的种类有数字、文字、图形、图像、声音、正文等。数据与其语义是不可分的。解析在现代计算机系统中数据的概念是广义的。早期的计算机系统主要用于科学计算,处理的数据是整数、实数、浮点数等传统数学中的数据。现代计算机能存储和处理的对象十分广泛,表示这些对象的数据…

  • Idea激活码永久有效Idea2021.3.2激活码教程-持续更新,一步到位

    Idea激活码永久有效Idea2021.3.2激活码教程-持续更新,一步到位Idea激活码永久有效2021.3.2激活码教程-Windows版永久激活-持续更新,Idea激活码2021.3.2成功激活

  • js获取键盘的keyCode——-Day42

    js获取键盘的keyCode——-Day42

    2021年11月29日
  • 不可错过的手机APP常见8种界面导航样式

    不可错过的手机APP常见8种界面导航样式

  • git 命令怎么删除本地分支「建议收藏」

    git 命令怎么删除本地分支「建议收藏」查看所有分支查看项目的分支:包括本地和远程gitbranch-a删除本地分支gitbranch-dgitbranch-d分支名-d是–delete的缩写,在使用–delete删除分支时,该分支必须完全和它的上游分支merge完成。如果没有完成merge就会报下面的gitbranch-dSP_4.3.0_previewerror:Thebranch’SP_4.3.0_preview’isnotfullymerged.If

    2022年10月17日
  • IIS防盗链技术

    IIS防盗链技术 “盗链”的定义是:此内容不在自己服务器上,而通过技术手段,绕过别人放广告有利益的最终页,直接在自己的有广告有利益的页面上向最终用户提供此内容。常常是一些名不见经传的小网站来盗取一些有实力的大网站的地址(比如一些音乐、图片、软件的下载地址)然后放置在自己的网站中,通过这种方法盗取大网站的空间和流量。  为什么会产生盗链  一般浏览有一个重要的现象就是一个完整的页面并不是一次全部传送到客户

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号