深度学习在人体动作识别领域的应用:开源工具、数据集资源及趋动云GPU算力不可或缺

news/2024/5/20 4:03:02/文章来源:https://blog.csdn.net/m0_49711991/article/details/134929923

人体动作识别检测是一种通过使用计算机视觉和深度学习技术,对人体姿态和动作进行实时监测和分析的技术。该技术旨在从图像或视频中提取有关人体姿态、动作和行为的信息,以便更深入地识别和理解人的活动。

人体动作识别检测的基本步骤包括:

  1. 数据采集:收集包含人体动作的图像或视频数据,这可以通过摄像头、深度传感器或其他传感器来完成。

  2. 预处理:对采集到的数据进行预处理,包括图像去噪、颜色调整等,以确保输入数据质量。

  3. 特征提取:提取图像或视频中的关键特征,例如人体关节点的位置、姿势等信息。

  4. 模型训练:使用深度学习模型,如卷积神经网络(CNN)或循环神经网络(RNN),对提取的特征进行训练,使模型能够识别和学习不同的人体动作。

  5. 实时检测:部署训练好的模型,对实时图像或视频进行检测,识别人体的姿态和动作。

上述步骤通常需要大规模 GPU 计算的支持。

为了更好地支持研究人员和开发者深入研究动作识别、检测、分类技术,本文将介绍一系列相关的开源工具箱、项目以及数据集资源。这些资源的综合使用将为动作相关技术的发展提供全面而有力的支持。

工具箱

MMSkeleton

MMSkeleton 是由香港中文大学多媒体实验室(MMLab)发布的一个基于骨架动作识别的视频分析开源工具箱,拥有领先的在视频中进行人体骨骼识别的能力,支持框架预训练模型,并提供多数据集。

开源地址:https://github.com/open-mmlab/mmskeleton

MMAction2

MMAction2 同样是由 MMLab 发布的一款基于 PyTorch 的视频理解开源工具箱,是 MMAction 的升级版,目前支持四大主流视频理解任务,分别是 Action Recognition、Skeleton based Action Recognition、Spatio-Temporal Action Detection 和 Temporal Action Localization。MMAction2 支持了 28 类视频理解模型 和 22 类视频理解数据集。

开源地址:https://github.com/open-mmlab/mmaction2

PYSKL

PYSKL 是在开源项目 MMAction2 的基础上进行构建的,使用 PYTorch 对骨架数据进行动作识别的工具箱。该工具箱支持多种骨架动作识别算法,包括基于 GCN 和 CNN 方法。

开源地址:https://github.com/kennymckormick/pyskl

数据集

EPIC-KITCHENS-100

EPIC-KITCHENS-100 是一个大规模的有关于厨房内第一视角活动的数据集,也是 Epic-kitchens-55 数据集的扩充版,视频总时长从 55 小时增加到了 100 小时,共包含超过 9 万个动作片段,97 个动词类别和 300 个名词类别。

论文链接:https://arxiv.org/abs/2006.13256

下载地址:https://epic-kitchens.github.io/2023

COIN

COIN 是由清华和美图共同开源的一个大规模视频分析数据集,包含 11827 条教程类视频,涉及日常生活中 12 个领域里的 180 个任务的视频内容。可以用于复杂场景下视频动作时序定位(temporal localization)、视频行为分析与理解问题的研究。

  • 论文链接:https://arxiv.org/abs/1903.02874

  • 下载地址:https://coin-dataset.github.io/

HOLLYWOOD2

HOLLYWOOD2 是一个人类行为动作视频数据集,内含 3669 个剪辑视频,视频总长度约为 20.1 小时,其中包括 12 类不同的人类行为动作,10 个场景,这些视频剪辑内容均来自 69 部好莱坞电影。

动作如:接电话、开车、吃饭、拥抱、接吻等。

场景如:户外、车内、厨房、办公室、商场、酒店等。

下载地址:https://www.di.ens.fr/~laptev/actions/hollywood2/

UCF Sports

UCF Sports 是一个主要关于运动的数据集,收集自 BBC 和 ESPN 的电视新闻,包含 150 段视频剪辑,视频分辨率为 720x480。

运动种类为:Diving、Golf Swing、Kicking、Lifting 、Riding Horse、Running、SkateBoarding、Swing-Bench、Swing-Side、Walking。

下载地址:https://www.crcv.ucf.edu/data/UCF_Sports_Action.php

UCF101

UCF101 数据集收集自 YouTube,是 UCF50 数据集的扩充版,从 50 个动作类别增加到 101 个类别,共 13320 个视频,这些视频都是由用户真实上传的,包含相机运动、各种照明条件、部分遮挡、低质帧等特点。

另外,该数据集主要包括 5 大类动作:人与物体交互,单纯的肢体动作,人与人交互,乐器演奏,体育运动。

下载地址:https://www.crcv.ucf.edu/data/UCF101.php


趋动云作为领先的算力服务提供商,不仅致力于提供灵活而成本可控的算力,同时还具备可扩展的存储解决方案。除此之外,趋动云还为用户提供了丰富多样的数据集资源,包括大规模的动作识别数据集如Kinetics-400UCF101等。

对于像Kinetics-400这样超过 100GB 的数据集,本地下载和训练需耗费大量时间,而在趋动云上,用户只需一键即可使用,极大地提升了用户的使用体验。

总体而言,GPU 算力在 AI 技术的发展中起到了至关重要的作用。它不仅推动了技术的创新,也为AI技术在各个领域的广泛应用奠定了基础。随着 GPU 算力的不断提升,我们可以期待看到更加强大、智能的动作识别技术,为我们的生活带来更丰富、便捷的体验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_568829.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用kibana查看es数据

前提 已安装好es还有kibana,启动es及kibana 修改kibana配置文件 在kibana文件中配置es的地址及索引,我的kibana安装在mac端了 修改配置文件 /usr/local/opt/kibana/config/kibana.yml 重启kibana 配置kibana 下面查询数据 例如查询 traceId 为192…

【TES720D-KIT】基于国内某厂商FMQL20S400全国产化ARM开发套件(核心板+底板)

板卡概述 TES720D-KIT是专门针对我司TES720D(基于国内某厂商FMQL20S400的全国产化ARM核心板)的一套开发套件,它包含1个TES720D核心板,加上一个TES720D-EXT扩展底板。 FMQL20S400是国内某厂商电子研制的全可编程融合芯片&#xf…

案例044:基于微信小程序的消防隐患在线举报系统

文末获取源码 开发语言:Java 框架:SSM JDK版本:JDK1.8 数据库:mysql 5.7 开发软件:eclipse/myeclipse/idea Maven包:Maven3.5.4 小程序框架:uniapp 小程序开发软件:HBuilder X 小程序…

Python将已标注的两张图片进行上下拼接并修改、合并其对应的Labelme标注文件(v2.0)

Python将已标注的两张图片进行上下拼接并修改、合并其对应的Labelme标注文件(v2.0) 前言前提条件相关介绍实验环境上下拼接图片并修改、合并其对应的Labelme标注文件代码实现输出结果 前言 此版代码,相较于Python将已标注的两张图片进行上下拼…

如何使用ArcGIS Pro裁剪影像

对影像进行裁剪是一项比较常规的操作,因为到手的影像可能是多种范围,需要根据自己需求进行裁剪,这里为大家介绍一下ArcGIS Pro中裁剪的方法,希望能对你有所帮助。 数据来源 本教程所使用的数据是从水经微图中下载的影像和行政区…

c语言:指针与数组

目录 使用指针访问数组 使用第一个元素获取数组首地址 使用数组名获取数组首地址 使用指针访问数组等价于下标访问 使用指针访问数组 指针类型的加减运算可以使指针内保存的首地址移动。指针类型加n后。首地址向后移动 n * 步长 字节。 指针类型减n后。首地址向前移动 n *…

26种主流的神经网络偏微分方程求解方法汇总

偏微分方程(PDE)是数学中一门重要的分支,应用范围广泛涉及自然科学、工程技术、生物学领域等。然而我们都知道,偏微分方程的求解过程异常艰难,如果碰上了特别复杂的,传统的计算方法可能需要数百万个CPU小时…

智能高效|AIRIOT智慧货运管理解决方案

随着全球贸易的增加和消费需求的不断扩大,货运行业面临更大的压力,传统货运行业运输效率低下、信息不透明,往往存在如下的运维问题和管理痛点: 无法实时定位和追踪信息:无法提供实时的货物位置信息,以便随…

解决firefox(火狐)浏览器使用transform: scale导致的border不显示或显示不全的问题;

最近火狐遇到了此问题,查了许久没有解决办法也有说是因为火狐不支持小于1px单位的,也有说火狐浏览器本身的问题,然后也没有解决方案,最后没办法只能用最笨的方法解决。。。。 只针对Firefox使用CSS,使用’-moz-documen…

poe与chatgpt那个功能更强大

在当前的人工智能领域,Poe Al Chat以其卓越的聊天能力和实用的功能,受到了大家的广泛关注和喜爱。本文好为您个绍Poe Al Chat的功能,以及我们国内用户如何进行充值订阅。Poe Al Chat是一个基于OpenAl的GPT模型开发的人工智能聊天工具。它能够…

代立冬:基于Apache Doris+SeaTunnel 实现多源实时数据仓库解决方案探索实践

大家好,我是白鲸开源的联合创始人代立冬,同时担任 Apache DolphinScheduler 的 PMC chair 和 SeaTunnel 的 PMC。作为 Apache Foundation 的成员和孵化器导师,我积极参与推动多个开源项目的发展,帮助它们通过孵化器成长为 Apache …

最简单的pixel刷机和安装面具、lsposed

一 下载手机对应的系统 1,手机usb连接然后重启进入Fastboot模式:adb reboot bootloader2,找到你下载的系统,Windows 系统 直接运行 flash-all.bat上图 :左边就是安卓11和12的系统,右边是对应的手机型号 下…

简记修复改etc下profile失败的补救措施

现象 下午配置环境变量一个小小的失误,把etc文件夹下的profile改崩了,导致很多基本命令都用不了,服务器出现了下面这种情况。 [rootxxxx ~]# vi /etc/profile -bash: vi: command not found [rootxxxxx~]# vi -bash: vi: command not found…

深度学习第5天:GAN生成对抗网络

☁️主页 Nowl 🔥专栏 《深度学习》 📑君子坐而论道,少年起而行之 ​​ 文章目录 一、GAN1.基本思想2.用途3.模型架构 二、具体任务与代码1.任务介绍2.导入库函数3.生成器与判别器4.预处理5.模型训练6.图片生成7.不同训练轮次的结果对比 一…

关于uniapp X 的最新消息

uni-app x 是什么? uni-app x,是下一代 uni-app,是一个跨平台应用开发引擎。 uni-app x 没有使用js和webview,它基于 uts 语言。在App端,uts在iOS编译为swift、在Android编译为kotlin,完全达到了原生应用的…

GoLong的学习之路,进阶,微服务之序列化协议,Protocol Buffers V3

这章是接上一章,使用RPC包,序列化中没有详细去讲,因为这一块需要看的和学习的地方很多。并且这一块是RPC中可以说是最重要的一块,也是性能的重要影响因子。今天这篇主要会讲其使用方式。 文章目录 Protocol Buffers V3 背景以及概…

【JavaWeb笔记】单选框,结合Servlet

各个部分的作用 jsp部分 form action"...":表单标签,供用户提交数据。内部的submit点击之后相当于是点action的URL input type"radio":输入类型为单选框。把name设置为一样的,这样效果上就是单选&#xff…

java飞翔的鸟游戏

A.准备工作 Bird类 Column类 BirdGame类 Ground类 B.中间过程 准备工作: 安装Java开发环境(JDK)。选择一个集成开发环境(IDE),如Eclipse、IntelliJ IDEA或NetBeans。 创建项目: 在IDE中创建一个…

平头哥玄铁系列 RISC-V 芯片及开发板

1、玄铁 9 系列概述 玄铁 8 系列 基于C-SKY架构,玄铁 9 系列基于 RISC-V 架构。E 系列为 RISC-V 32 位,C 系列为 RISC-V 64 位。 E902:超低功耗 RSIC-V 架构处理器 E902 采用 2 级极简流水线兼容 RISC-V 架构且对执行效率等方面进行了增强&a…

【教程】制作 iOS 推送证书

​ 目录 证书类型 MAC Key Store 消息推送控制台 制作证书 创建苹果 App ID 使用appuploder制作 .p12文件 创建证书 如需向 iOS 设备推送数据,您首先需要在消息推送控制台上配置 iOS 推送证书。iOS 推送证书用于推送通知,本文将介绍消息推送服务支…