长尾分布数据_厚尾分布

长尾分布数据_厚尾分布长尾分布数据11.什么是长尾分布数据长尾分布数据是一种偏态分布,是指几个类别(亦叫头类)包含大量的样本,而大多数类别(亦叫尾类)只有非常少量的样本。类似这样的数据集会使得深度学习网络在头部类中表现良好,在尾部类中效率不高,整体的识别精度显著下降。2.解决办法大多数研究者通过不平衡学习策略来解决长尾识别问题,主要分为两类:数据级方法和算法级方法。数据级方法数据水平的策略包括尾部类过采样,头部类欠采样,以及其他新的抽样方法。所以解决手段主要着力于如何对数据进行抽样。这种方法存在的问题是,过采

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

长尾分布数据1

1. 什么是长尾分布数据

长尾分布数据是一种偏态分布,是指几个类别(亦叫头类)包含大量的样本,而大多数类别(亦叫尾类)只有非常少量的样本。

在这里插入图片描述

类似这样的数据集会使得深度学习网络在头部类中表现良好,在尾部类中效率不高,整体的识别精度显著下降。

2. 解决办法

大多数研究者通过不平衡学习策略来解决长尾识别问题,主要分为两类:数据级方法和算法级方法。

数据级方法

数据水平的策略包括尾部类过采样,头部类欠采样,以及其他新的抽样方法。所以解决手段主要着力于如何对数据进行抽样。这种方法存在的问题是,过采样会导致过拟合,欠采样会导致头部类大量有效信息丢失。

算法级方法

  • 通过成本敏感算法来调整类别权重,一定程度缓解长尾分布不平衡问题,提高了尾类识别精度,但降低了头类精度。
  • 将头部数据中学习到的知识迁移到尾类,这种迁移学习的缺点是在头尾类特征相差特别大的时候,效果不好。如头类是动物,尾类是植物。
  • 层次学习方法,将长尾识别问题转为层次化超类学习问题。知识的迁移是受限的,只能从超类转移到它的直接子类。如尾类哈士奇的识别过程中,首先将其识别为头类的动物类,再归类为一只哈士奇狗。这个过程中,动物的知识不会转移到植物类。即,对头部类的知识迁移进行了限制,限制的方式是父子类层次关联。

Reference


  1. Q. Chen, Q. Liu和E. Lin, 《A knowledge-guide hierarchical learning method for long-tailed image classification》, Neurocomputing, 卷 459, 页 408–418, 10月 2021, doi: 10.1016/j.neucom.2021.07.008. ↩︎

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/204018.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • werfault进程使用CPU率高

    werfault进程使用CPU率高werfault进程是Windowsvista错误报告进程,是用来向微软反馈报告。是安全的正常进程。解决方法:1.打开控制面板”—“系统和维护”,点击“问题报告和解决方案”。2.点击“更改设置”—“高级设置”。3.接下来的“对于所有用户和应用程序,问题报告被设置为”,点击右边个“更改设置”。4.在弹出窗口,选择“关闭”。补充:xp系统下禁用错误报告简单方法:1.我的电脑…

  • Linux服务器php环境搭建教程

    Linux服务器php环境搭建教程RT.以前服务器端是使用phpnow套件。今天尝试在ubuntu下独立完成apache2+php+mysql的服务器运行环境。具体的步骤如下(下面的操作都需要使用root权限):|.Apache2安装sudoapt-getinstallapache2安装的成功标志是你在浏览器中打开127.0.0.1的时候会显示“Itworks!”的字眼。apache2访

  • 【转载】这才是真正的分布式锁

    【转载】这才是真正的分布式锁

    2021年11月20日
  • 如何理解java中的方法

    如何理解java中的方法

  • 7000词汇这么背我比较可以接受,连续看20天足以[通俗易懂]

    7000词汇这么背我比较可以接受,连续看20天足以[通俗易懂]
    16天记住7000考研词汇(第一天)

    1.WithmyownearsIclearlyheardtheheartbeatofthenuclearbomb.
    我亲耳清楚地听到原子弹的心脏的跳动。
    2.Nextyearthebeardedbearwillbearadearbabyintherear.
    明年,长胡子的熊将在后方产一头可爱的小崽.
    3.EarlyIsearchedthr

  • pytest fixtures_pytest allure

    pytest fixtures_pytest allurefixture的优势Pytest的fixture相对于传统的xUnit的setup/teardown函数做了显著的改进:命名方式灵活,不局限于setup和teardown这几个命名conf

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号