目标检测——day46 可转移交互性知识的人机交互检测

news/2024/4/20 17:46:42/文章来源:https://blog.csdn.net/qq_43537420/article/details/127450631

Transferable Interactiveness Knowledge for Human-Object Interaction Detection

论文pdf下载（含笔记）
Transferable Interactiveness Knowledge for Human-Object Interaction Detection
1 INTRODUCTION
3 PRELIMINARY
4 METHOD
- 4.1 Overview
- 4.2 Representation and Classiﬁcation Networks
- 4.3 Interactiveness Network
- - 4.3.1 Three Streams With Instance-Level Features
  - 4.3.2 Part Stream With Part-Level Features
  - 4.3.3 Binary Interactiveness Classiﬁer
  - 4.3.4 Interactiveness Consistency
- 4.4 Testing With Non-Interaction Suppression

Human-Object Interaction Detection)

论文pdf下载（含笔记）

点击下载

Transferable Interactiveness Knowledge for Human-Object Interaction Detection

1 INTRODUCTION

在这里插入图片描述

Fig. 1，与传统HOI相比，本文所提出的HOI增加了交互性知识的学习

不仅提升了HOI检测性能
交互性知识超出了HOI类别，可以跨数据集学习，这可以带来更大的性能改进

3 PRELIMINARY

在这里插入图片描述

Fig. 2，图二中展示了HOI中(人，物)所构成的图，并且由提出的非相关抑制将稠密图变为稀疏图，然后进行分类。

4 METHOD

4.1 Overview

在这里插入图片描述

我们的TIN框架的概述如 Fig. 3所示。

我们提出了交互性网络D（交互性鉴别器），它利用交互性来减少由过多的非交互性候选对引起的误报。利用学习到的交互性知识来评估边的交互性，从而将稠密的HOI图转换为稀疏的图
R负责从检测到的实例中提取特征
C对稀疏图进行处理，利用节点和边缘特征对HOIs进行分类

4.2 Representation and Classiﬁcation Networks

简要介绍表示网络R和分类网络C

Representation Network，在训练和测试过程中，R被冻结，并作为一个特征提取器。给定检测到的边界框，我们通过根据框坐标裁剪ROI池特征图来生成人和对象特征
Classiﬁcation Network，使用多流架构和后期融合策略，如Fig. 5所示，分为人、物和空间三个通道，确定多个人和物的交互性需要用到空间流进行判断。在这里插入图片描述

4.3 Interactiveness Network

交互性网络d被设计用于二进制分类：交互式/非交互式，d中有四种流（人、物体、空间姿态和部分），每一种流都侧重于图像中HOIs的不同元素。交互性网络D的体系结构如Fig. 4所示。在这里插入图片描述

4.3.1 Three Streams With Instance-Level Features

需要通过提取和组合基本信息来学习交互性。显然需要人和物体的视觉外观。此外，交互式和非交互式对还具有其他显着特征，例如空间位置和人类姿势信息。
在这里插入图片描述

D需要将所有这些关键元素编码在一起，以学习互动性知识。

4.3.2 Part Stream With Part-Level Features

探索在互动学习中采用人体部分特征。
在这里插入图片描述

首先使用姿态估计构建了10个零件框Fig. 6，即头部、上臂、手、臀部、大腿和脚。每个零件箱都以相应的检测接头为中心。零件盒的大小是通过测量颈部和骨盆关节之间的距离来决定的。其次，对于部分流，我们从检测到的部分框中提取ROI池特征作为部分特征。

4.3.3 Binary Interactiveness Classiﬁer

在这里插入图片描述

D中有11个结构交互的二值分类器（Fig. 4中的“交互分类器”），即10个部分交互，实例交互1个。它们都将上述四个流中的四种特征作为输入，并由简单的连接操作和全连接层层构造。交互性分类器的详细结构如Fig. 4右上方所示。

4.3.4 Interactiveness Consistency

当且仅当至少一个身体部位与物体互动时，人是互动的，当且仅当没有一个互动时，人不是互动的。

对于一个人-对象对，我们的方法的预测应该遵循：
预测的交互性得分来构建一致性损失：
综上所述，交互性鉴别器D的损失可以表示为：

4.4 Testing With Non-Interaction Suppression

在这里插入图片描述

如Fig.7，提出了一种低级别抑制功能（LIS），它具有增强区分高低级别物体检测的能力。高分检测对象将被强调并与低分对象区分

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.luyixian.cn/news_show_404440.aspx

如若内容造成侵权/违法违规/事实不符，请联系dt猫网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

JVM——类加载子系统

JVM——类加载子系统

文章目录一、类加载器子系统作用二、类加载过程1、加载（Loading）2、验证（Verification）3、准备（Preparation）4、解析（Resolution）5、初始化（Initialization）三…

阅读更多...

SpringCloud微服务实践之三创建子项目UserService

SpringCloud微服务实践之三创建子项目UserService

创建子项目UserService，并将服务注册到Eureka UserService子项目作为用户信息的服务提供方，通过本项目，可以实现对基于Docker运行的mysql数据库表的读取。 1、在父项目上点击鼠标右键选择new→Module： 过程同上，略过…

阅读更多...

基于jeecgboot的flowable驳回修改以及发起人设置

基于jeecgboot的flowable驳回修改以及发起人设置

昨晚升级代码生成器，支持生成权限注解和菜单的SQL,修改驳回bug,以后保存流程强制要求第一个用户任务节点必须是发起人节点。 1、前端增加发起人设置 <el-radio label"INITIATOR">发起人</el-radio> 相应代码 if (this.containsKey(this.bpmn…

阅读更多...

MybatisPlus【SpringBoot】 3 基本CRUD

MybatisPlus【SpringBoot】 3 基本CRUD

MybatisPlus【SpringBoot】【【尚硅谷】2022版MyBatisPlus教程（一套玩转mybatis-plus）】 3 基本CRUD 文章目录MybatisPlus【SpringBoot】3 基本CRUD3.1 BaseMapper3.2 插入3.3 删除3.3.1 通过id 删除记录3.3.2 通过id 批量删除记录3.3.3 通过map 条件…

阅读更多...

【Svelte】-（7）绑定｜Each 块绑定 / audio video 媒体标签绑定 / client offset 尺寸绑定 / this / 组件绑定

【Svelte】-（7）绑定｜Each 块绑定 / audio video 媒体标签绑定 / client offset 尺寸绑定 / this / 组件绑定

文章目录Each 块绑定媒体标签绑定尺寸绑定this组件绑定Each 块绑定您也可以在 Each 的过程中使用。不过需要注意的是，与这些 <input> 交互会改变数组。当要使用不可变数据，应该去避免使用这些绑定，并且改用事件来处理这些内容。 <…

阅读更多...

nvm切换node版本

nvm切换node版本

在实际的前端开发过程中，可能会经常遇见 node.js 的版本问题，不同的项目需要使用不同的 node.js 版本。比如Vue2和Vue3需要的Node版本不一样。地址：https://github.com/coreybutler/nvm-windows/releases 注意：安装之前必须完…

阅读更多...

[LCT刷题][树链信息维护] P4332 [SHOI2014]三叉神经树

[LCT刷题][树链信息维护] P4332 [SHOI2014]三叉神经树

写在前面把黑题看成蓝题结果想了老半天感觉不对劲本题对于理解SplaySplaySplay和LCTLCTLCT结构具有至关重要的意义，值得反复思考。可能因为我比较菜题目思路题目给定一个类似神经网络的东西，每个节点都具有激活层、三输入单输出，输…

阅读更多...

node.js+vue+Web的疫情大数据平台分析系统

node.js+vue+Web的疫情大数据平台分析系统

以往的疫情防控管理事务处理主要使用的是传统的人工管理方式，这种管理方式存在着管理效率低、操作流程繁琐、保密性差等缺点，长期的人工管理模式会产生大量的文本文件与文本数据，这对事务的查询、更新以及维护带来不少困难。随着互联网时代的…

阅读更多...

Google共码未来与 C站创造者的经历

Google共码未来与 C站创造者的经历

本人仅参加一天活动 2022.9.14；吃喝拉撒全免费哈哈哈大会主题：共码未来 looker、chromium、wouldnt、jetpack looker https://blog.csdn.net/WebEye_Marketing/article/details/116047404 chromium https://blog.csdn.net/arv002/article/details/1…

阅读更多...

SEO和SEM的区别是什么，哪个效果更好一些

SEO指的是搜索引擎优化，SEM指的是搜索引擎影响，那么SEO和SEM的区别具体是什么？对于初创业的企业来说，哪个更好呢？下面，本文将介绍SEO和SEM的区别，帮助企业和公司网络人员理清这两者的优劣势。 S…

阅读更多...

【力扣刷题】Day31——DP专题

【力扣刷题】Day31——DP专题

文章目录七、子序列问题（线性DP and 区间DP）1、子序列（不连续）29.最长递增子序列（LIS）30. 最长公共子序列 （LCS）31.不相交的线2、子序列（连续）32. 最长连续递…

阅读更多...

C语言中的指针

C语言中的指针

一。什么是指针？ 在计算机科学中，指针（Pointer）是编程语言中的一个对象，利用地址，它的值直接指向（points to）存在电脑存储器中另一个地方的值。由于通过地址能找到所需的变量单元&a…

阅读更多...

一棋盘的麦子

一棋盘的麦子

14天阅读挑战赛有一个古老的传说，一位国王的女儿不幸落水，水中有很多鳄鱼，国王情急之下下令： 来，就把女儿嫁给他。”很多人纷纷退让，一个勇敢的小伙子挺身而出，冒着生命危险把公一看是个穷小子…

阅读更多...

Java程序员快速掌握前端知识

Java程序员快速掌握前端知识

Java程序员是一个需要终身学习的岗位，加之技术更新迭代越来越快，程序员们不得不坚持提升自己，上班可能接触到新事物，下班也要抓紧时间钻研，才能不被时代淘汰。前端技术，Java程序员可以不精通，…

阅读更多...

新手如何自学python？

新手如何自学python？

对于初学者来说，视频教程相比于书籍更加直观有效，可以先看视频进行学习，然后再看书进行深刻学习~下面就给你分享下教程以及书籍~ 网站 1. 网易公开课 https://open.163.com/ 2. 腾讯课堂 https://ke.qq.com/ 3. 中国大学慕课 https://www.…

阅读更多...

xxl-job反序列化漏洞分析复现

xxl-job反序列化漏洞分析复现

01 影响范围 Xxl-Job<2.1.2，需要利用Hessian触发。 02 环境搭建下载地址：https://github.com/xuxueli/xxl-job/releases 修改配置文件 xxl-job-2.0.1/xxl-job-admin/src/main/resources/application.properties 修改数据库信息，以及…

阅读更多...

动手写数据库：实现记录管理

动手写数据库：实现记录管理

在数据库中，数据以”记录“作为一个单元来存储，例如一个表的“一行”就对应一条记录。假设我们有一个表叫STUDENT，其中有name, age, sex, class等字段，那么一条记录的信息就由这四个字段对应的信息合成。一条记录如何存储并不是一…

阅读更多...

FFmpeg入门详解之110：RTSP协议讲解

FFmpeg入门详解之110：RTSP协议讲解

RTSP亲手搭建直播点播测试工具：VLC 数据源： 文件或本地摄像头测试功能：RTSP直播点播播放地址：rtsp://127.0.0.1:8554/rtspa001 服务端：推流客户端：拉流 RTSP（Real Time Streaming Pro…

阅读更多...

Windows定时截屏、后台自动截屏工具，带有密码保护功能 —— 定时执行专家

Windows定时截屏、后台自动截屏工具，带有密码保护功能 —— 定时执行专家

目录一、软件简介二、使用教程 1、软件下载 2、软件的安装方法 3、无察觉自动截屏（例如：间隔每 10分钟，执行 1次） 一、软件简介《定时执行专家》是一款制作精良、功能强大、简单易用、毫秒级精度、专业级的定时任务执行软…

阅读更多...

Windows Server安全日志与系统事件变更审计

Windows Server安全日志与系统事件变更审计

了解用户何时变更计算机内部时钟上的时间和日期。如果系统时间已变更，记录的事件将反映此新时间，而不是事件发生的实际时间。对系统时间不正确的变更可对应用程序造成严重破坏。您可在Windows 2003 / 2008 / 2012计算机的安全日志中找到有价值信息&…

阅读更多...

推荐文章

最新文章