OHEM在线难样例挖掘的两个细节

OHEM在线难样例挖掘的两个细节代码上如何实现Read-onlyLayer与R_hard-sel权限共享?https://github.com/abhi2610/ohem/blob/master/models/pascal_voc/VGG_CNN_M_1024/fast_rcnn_ohem/train.prototxt下面代码对应(a),前向传播过程##ReadonlyRoINetworklayer{…

大家好,又见面了,我是你们的朋友全栈君。

在这里插入图片描述
代码上如何实现Read-only Layer与R _hard-sel权限共享?
https://github.com/abhi2610/ohem/blob/master/models/pascal_voc/VGG_CNN_M_1024/fast_rcnn_ohem/train.prototxt
下面代码对应(a),前向传播过程

## Readonly RoI Network 
layer {
  name: "roi_pool5_readonly"
  type: "ROIPooling"
  bottom: "conv5"
  bottom: "rois"
  top: "pool5_readonly"
  propagate_down: false
  propagate_down: false
  roi_pooling_param {
    pooled_w: 6
    pooled_h: 6
    spatial_scale: 0.0625 # 1/16
  }
}

其中:propagate_down设置为false,可实现forward inference

下面代码对应(b),前向和反向传播过程

layer {
  name: "roi_pool5"
  type: "ROIPooling"
  bottom: "conv5"
  bottom: "rois_hard"
  top: "pool5"
  propagate_down: true
  propagate_down: false
  roi_pooling_param {
    pooled_w: 6
    pooled_h: 6
    spatial_scale: 0.0625 # 1/16
  }
}

其中:propagate_down设置为True,可实现前向和后向传播,减小难样例的损失,同时可以调整卷积层的参数

为什么要hard mining?

  • 1 减少fg和bg的ratio,而且不需要人为设计这个ratio
  • 2 加速收敛,减少显存需要这些硬件的条件依赖,原因是直接训练难样例,使损失最大的函数对应的样例经过训练后loss 直接减小
  • 3 hard-mining已经证实了是一种booststrapping的方式, 尤其当数据集较大而且较难的时候;
  • 4 eliminates several heuristics and hyperparameters in common use by automatically selecting hard examples, thus simplifying training。 放宽了定义negative example的bg_lo threshold,即从[0.1, 0.5)变化到[0, 0.5)。
    取消了正负样本在mini-batch里的ratio(原Fast-RCNN的ratio为1:3)

参考:https://blog.csdn.net/qq_36302589/article/details/84998509

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/139299.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • nginx负载均衡算法有哪些_dubbo负载均衡算法

    nginx负载均衡算法有哪些_dubbo负载均衡算法nginx负载均衡的几种算法

    2022年10月12日
  • 一种并行随机梯度下降法是什么_随机梯度下降法

    一种并行随机梯度下降法是什么_随机梯度下降法MartinA.Zinkevich等人(Yahoo!Lab)合作的论文ParallelizedStochasticGradientDescent中给出了一种适合于MapReduce的并行随机梯度下降法,并给出了相应的收敛性分析。这里忽略理论部分,根据自己的理解给出文中所提并行随机梯度下降法的描述。

  • 三菱plc编写最简单的梯形图演示_三菱plc梯形图实例详解

    三菱plc编写最简单的梯形图演示_三菱plc梯形图实例详解梯形图言语是一种以图形符号及图形符号在图中的彼此联络标明操控联络的编程言语,是从继电器电路图演化过来的。继电器操控电路图与plc操控的梯形图的比照梯形图与继电器操控电路图两者之间存在很多区别:(1)PLC选用梯形图编程是仿照继电器操控体系的标明方法,因而梯形图内各种元件也沿袭了继电器的叫法,称之为“软继电器”,例如X0、X1(输入继电器)、Y0(输出继电器)。梯形图中的“软继电器”不是物理继电器,…

  • oracle误删数据怎么恢复_oracle数据库恢复数据

    oracle误删数据怎么恢复_oracle数据库恢复数据学习数据库时,我们只是以学习的态度,考虑如何使用数据库命令语句,并未想过工作中,如果误操作一下,都可能导致无可挽回的损失。当我在工作中真正遇到这些问题时,我开始寻找答案。今天主要以oracle数据库为例,介绍关于表中数据删除的解决办法。(不考虑全库备份和利用归档日志)删除表中数据有三种方法:·delete(删除一条记录)·drop或truncate删除表格中数据1.delete

  • md5加密规则[通俗易懂]

    md5加密规则[通俗易懂]关于MD5加密  MD5的典型应用是对一段信息(Message)产生信息摘要(Message-Digest),以防止被篡改。比如,在UNIX下有很多软件在下载的时候都有一个文件名相同,文件扩展名为.md5的文件,在这个文件中通常只有一行文本,大致结构如:  MD5(tanajiya.tar.gz)=0ca175b9c0f726a831d895e269332461  这就是

  • 完美解决方案_onActivityResult

    完美解决方案_onActivityResult在Service中启动Activity,会报错如下:Intentintent=newIntent(MyService.this,Main2Activity.class);startActivity(intent);…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号