行为识别数据集汇总[通俗易懂]

行为识别数据集汇总[通俗易懂]工欲善其事,必先利其器http://www.cs.utexas.edu/~chaoyeh/web_action_data/dataset_list.html,此链接内容更全,可惜整理完后发现的。1.TheKTHDataset(2004)KTH数据集于2004年的发布,是计算机视觉领域的一个里程碑。此后,许多新的数据库陆续发布。数据库包括在4个不同场景下25个人完成的6…

大家好,又见面了,我是你们的朋友全栈君。

工欲善其事,必先利其器

http://www.cs.utexas.edu/~chaoyeh/web_action_data/dataset_list.html,此链接内容更全,可惜整理完后发现的。

1. The KTH Dataset(2004)

KTH数据集于2004 年的发布,是计算机视觉领域的一个里程碑。此后,许多新的数据库陆续发布。数据库包括在 4个不同场景下 25 个人完成的 6 类动作(walking, jogging, running,boxing, hand waving and hand clapping)共计 2391个视频样本,是当时拍摄的最大的人体动作数据库,它使得采用同样的输入数据对不同算法的性能作系统的评估成为可能。数据库的视频样本中包含了尺度变化、 衣着变化和光照变化,但其背景比较单一,相机也是固定的。下载地址:http://www.nada.kth.se/cvap/actions/

但是现在该数据集无法下载了(本人在这个网站中未能下载下);发现数据堂上面有,有点贵。本人有一份,free。

 http://pan.baidu.com/s/1hsuQktA 密码: rfr7 .记得点赞

 

2. The Weizmann Dataset(2005)

2005年,以色列 Weizmann institute 发布了Weizmann 数据库。数据库包含了 10个动作(bend, jack, jump, pjump, run,side, skip, walk, wave1,wave2),每个动作有 9 个不同的样本。视频的视角是固定的,背景相对简单,每一帧中只有 1 个人做动作。数据库中标定数据除了类别标记外还包括:前景的行为人剪影和用于背景抽取的背景序列。下载地址:http://www.wisdom.weizmann.ac.il/~vision/SpaceTimeActions.html

KTH 和 Weizmann 数据库是行为识别领域引用率最高的数据库,对行为识别的研究起了较大的促进作用。当然,这两个数据库的局限性也是很明显的,由于背景比较简单,没有包含相机运动, 动作种类也较少,并且每段视频只有1个人在做单一的运动,这与真实的场景差别很大。

3. The IXMAS Dataset(2006)

该数据库为多视角数据库,该数据库从五个视角获得,室内四个方向和头顶一共安装5个摄像头,另外背景和光照基本不变。包含了11个人做14个动作,重复3次,这14个动作包括{check watch, cross arms, scratch head, sit down, get up, turnaround, walk, wave, punch, kick, point, pick up, throw (over head), throw (frombottom up)}。下载地址:http://4drepository.inrialpes.fr/public/viewgroup/6

 

4. The Hollywood Dataset(2008、2009)

Hollywood(2008年发布)、Hollywood-2数据库是由法国IRISA研究院发布的。早先发布的数据库基本上都是在受控的环境下拍摄的,所拍摄视频样本有限。2009年发布的Hollywood-2是Hollywood数据库的拓展版,包含了 12 个动作类别和 10个场景共3669个样本,所有样本均是从69部 Hollywood 电影中抽取出来的。视频样本中行为人的表情、姿态、穿着,以及相机运动、光照变化、遮挡、背景等变化很大,接近于真实场景下的情况,因而对于行为的分析识别极具挑战性。下载地址:http://www.di.ens.fr/~laptev/actions/hollywood2/

 

5. The UCF Dataset(2007-)

美国University of central Florida(UCF)自2007年以来发布的一系列数据库:1UCF sports action dataset(2008),2UCF Youtube(2008),3UCF50,4UCF101,引起了广泛关注。这些数据库样本来自从 BBC/ESPN的广播电视频道收集的各类运动样本、以及从互联网尤其是视频网站YouTube上下载而来的样本。其中UCF101是目前动作类别数、样本数最多的数据库之一,样本为13320段视频,类别数为101类。

下载地址:http://crcv.ucf.edu/data/

  

6. The Olympic sports dataset UCF sports action dataset(2010)

Stanford university2010年发布Olympic sports dataset UCF sports action dataset,包含了运动员的各类运动视频。视频都是从YouTube上下载的,包含有16个运动类别的50个视频,标记信息为运动类别。

下载地址:http://vision.stanford.edu/Datasets/OlympicSports/

 

7. The UT-interactiondataset

UT-interaction database是针对交互行为的数据库,包含有6类人人交互的动作(shaking hands, pointing, hugging,pushing, kicking and punching)总共 20 段样本,长度在 1 min 左右。

下载地址:http://cvrc.ece.utexas.edu/SDHA2010/Human_Interaction.html

 

8. The VideoWebdataset(2010)

California大学的VideoWebdatabase于 2010年发布,该数据库重点放在多人间的非语言交流的行为上(non-verbal communication),包含由最少4个至第4期视频序列中的行为识别研究进展多8个摄像机拍摄的长度为2.5min的视频。(未找到链接)

 

9. The HMDB51 dataset(2011)

Brown university大学发布的HMDB51于2011年发布,视频多数来源于电影,还有一部分来自公共数据库以及YouTube等网络视频库。数据库包含有6849段样本,分为51类,每类至少包含有101段样本。

下载地址:http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#dataset

 

除此之外还有:CMU MoBo DataSet(2001)、CMU MoCapDataSet(2006)、Human Eva(2009)、i3DPostMultiView(2009)

 

总体而言,数据库的动作类别越来越多,样本越来越多,数据库也更庞大,视频场景越来越复杂。较早的数据库,比如KTH,视频背景较简单,动作类别不多,相机固定,这使得现有的算法很容易达到饱和,不好区分算法的优劣。最近几年发布的数据库有如下几个趋势:背景嘈杂,视角不固定,甚至相机是运动的; 样本涉及到人人交互,人物交互;行为类别数较最早发布的数据库多了很多,总之是更接近于不受控的自然状态下的情景,这对于算法的鲁棒性提出了很大的挑战。

 

参考文献:徐勤军, 吴镇扬. 视频序列中的行为识别研究进展[J]. 电子测量与仪器学报, 2014, 28(4):343-351.

                 http://blog.csdn.net/zdz8889/article/details/9207083

                 http://blog.sina.com.cn/s/blog_631a4cc40101138j.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/152015.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 提升进程权限函数OpenProcessToken 及相关函数详解

    提升进程权限函数OpenProcessToken 及相关函数详解提升进程权限函数OpenProcessToken及相关函数详解http://m.blog.csdn.net/blog/Armstronghappy/8797630 LookupPrivilegeValue函数查看系统权限的特权值,返回信息到一个LUID结构体里。BOOLLookupPrivilegeValue(LPCTSTRlpSystemName,LPCTSTRlpN

  • CSS3选择器介绍及用法总结[通俗易懂]

    CSS3选择器介绍及用法总结[通俗易懂]CSS3新增了很多强大的选择器它可以让我们少写一些js事件脚本我们先来看看各个版本的选择器有哪些注:ele代表element元素attr代表attribute属性,val代表value属性值:xxx都属于伪类选择器,::xxx都属于伪元素选择器有名字的选择器我尽量细分了CCS1选择器选择器类型示例说明.class类选择器.demo

  • PHP基础

    PHP基础前言发现PHP审计和利用的一些漏洞利用场景挺有意思的,来学习一下php基础内容,大部分概念和代码和Java或c++的差不多,挑些php独有的特性来做记录。基础知识超级全局变量PHP

    2021年12月13日
  • 初识ABP vNext(12):模块的独立运行与托管

    初识ABP vNext(12):模块的独立运行与托管

    2020年11月20日
  • 用GHOST备份ubuntu系统

    用GHOST备份ubuntu系统
    由于在折腾ubuntu系统过程中经常出错(有一次由于更改分辨率导致黑屏,折腾了大半夜才修复好),于是特想能够找到一种简便有效的备份方法。

    上网一搜,老鸟们都说用tar备份。搜到了命令,复制下来,往终端上一贴,能进行,可是结尾时总出错。几个版本的命令都不行。经研究和上网搜索,搞明白这命令在纯文本(纯命令)下才行,桌面下根本不行(估计那些网上的tar备份者也是人云亦云,自己根本没试过)。

    Ctrl+Alt+F2进入纯命令界面,一片漆黑的背景上几个字母,根本

  • java中文乱码怎么解决_java中文乱码解决总结

    java中文乱码怎么解决_java中文乱码解决总结为什么说乱码是中国程序员无法避免的话题呢?这个首先要从编码机制上说起,大家都是中文和英文的编码格式不是一样,解码也是不一样的!如果中国的程序员不会遇到乱码,那么只有使用汉语编程。汉语编程是怎么回事我也不大清楚,应该是前年吧,我一朋友给我介绍汉语编程,怎么不错不错?当时因为学习忙没去关注这个,等我闲了,那个朋友不弄这个,问他他也不说不大清楚,最后自己对这个学习也不了了之了。今天我写这个不是讲解中英文…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号