目标检测——day46 可转移交互性知识的人机交互检测

news/2024/4/20 17:46:42/文章来源:https://blog.csdn.net/qq_43537420/article/details/127450631

Transferable Interactiveness Knowledge for Human-Object Interaction Detection

  • 论文pdf下载(含笔记)
  • Transferable Interactiveness Knowledge for Human-Object Interaction Detection
  • 1 INTRODUCTION
  • 3 PRELIMINARY
  • 4 METHOD
    • 4.1 Overview
    • 4.2 Representation and Classification Networks
    • 4.3 Interactiveness Network
      • 4.3.1 Three Streams With Instance-Level Features
      • 4.3.2 Part Stream With Part-Level Features
      • 4.3.3 Binary Interactiveness Classifier
      • 4.3.4 Interactiveness Consistency
    • 4.4 Testing With Non-Interaction Suppression

Human-Object Interaction Detection)

论文pdf下载(含笔记)

点击下载

Transferable Interactiveness Knowledge for Human-Object Interaction Detection

1 INTRODUCTION

在这里插入图片描述

Fig. 1,与传统HOI相比,本文所提出的HOI增加了交互性知识的学习

  1. 不仅提升了HOI检测性能
  2. 交互性知识超出了HOI类别,可以跨数据集学习,这可以带来更大的性能改进

3 PRELIMINARY

在这里插入图片描述

Fig. 2,图二中展示了HOI中(人,物)所构成的图,并且由提出的非相关抑制将稠密图变为稀疏图,然后进行分类。

4 METHOD

4.1 Overview

在这里插入图片描述

我们的TIN框架的概述如 Fig. 3所示。

  1. 我们提出了交互性网络D(交互性鉴别器),它利用交互性来减少由过多的非交互性候选对引起的误报。利用学习到的交互性知识来评估边的交互性,从而将稠密的HOI图转换为稀疏的图
  2. R负责从检测到的实例中提取特征
  3. C对稀疏图进行处理,利用节点和边缘特征对HOIs进行分类

4.2 Representation and Classification Networks

简要介绍表示网络R分类网络C

Representation Network,在训练和测试过程中,R被冻结,并作为一个特征提取器。给定检测到的边界框,我们通过根据框坐标裁剪ROI池特征图来生成人和对象特征
Classification Network,使用多流架构和后期融合策略,如Fig. 5所示,分为人、物和空间三个通道,确定多个人和物的交互性需要用到空间流进行判断。在这里插入图片描述

4.3 Interactiveness Network

交互性网络d被设计用于二进制分类:交互式/非交互式,d中有四种流(人、物体、空间姿态和部分),每一种流都侧重于图像中HOIs的不同元素。交互性网络D的体系结构如Fig. 4所示。在这里插入图片描述

4.3.1 Three Streams With Instance-Level Features

需要通过提取和组合基本信息来学习交互性。显然需要人和物体的视觉外观。此外,交互式和非交互式对还具有其他显着特征,例如空间位置和人类姿势信息。
在这里插入图片描述

D需要将所有这些关键元素编码在一起,以学习互动性知识。

4.3.2 Part Stream With Part-Level Features

探索在互动学习中采用人体部分特征。
在这里插入图片描述

首先使用姿态估计构建了10个零件框Fig. 6,即头部、上臂、手、臀部、大腿和脚。每个零件箱都以相应的检测接头为中心。零件盒的大小是通过测量颈部和骨盆关节之间的距离来决定的。其次,对于部分流,我们从检测到的部分框中提取ROI池特征作为部分特征。

4.3.3 Binary Interactiveness Classifier

在这里插入图片描述

D中有11个结构交互的二值分类器(Fig. 4中的“交互分类器”),即10个部分交互,实例交互1个。它们都将上述四个流中的四种特征作为输入,并由简单的连接操作和全连接层层构造。交互性分类器的详细结构如Fig. 4右上方所示。

4.3.4 Interactiveness Consistency

当且仅当至少一个身体部位与物体互动时,人是互动的,当且仅当没有一个互动时,人不是互动的。

  1. 对于一个人-对象对,我们的方法的预测应该遵循:在这里插入图片描述

  2. 预测的交互性得分来构建一致性损失:在这里插入图片描述

  3. 综上所述,交互性鉴别器D的损失可以表示为:在这里插入图片描述

4.4 Testing With Non-Interaction Suppression

在这里插入图片描述

Fig.7,提出了一种低级别抑制功能(LIS),它具有增强区分高低级别物体检测的能力。高分检测对象将被强调并与低分对象区分

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_404440.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JVM——类加载子系统

文章目录一、类加载器子系统作用二、类加载过程1、加载(Loading)2、验证(Verification)3、准备(Preparation)4、解析(Resolution)5、初始化(Initialization)三…

SpringCloud微服务实践之三 创建子项目UserService

创建子项目UserService,并将服务注册到Eureka UserService子项目作为用户信息的服务提供方,通过本项目,可以实现对基于Docker运行的mysql数据库表的读取。 1、在父项目上点击鼠标右键选择new→Module: 过程同上,略过…

基于jeecgboot的flowable驳回修改以及发起人设置

昨晚升级代码生成器&#xff0c;支持生成权限注解和菜单的SQL,修改驳回bug,以后保存流程强制要求第一个用户任务节点必须是发起人节点。 1、前端增加发起人设置 <el-radio label"INITIATOR">发起人</el-radio> 相应代码 if (this.containsKey(this.bpmn…

MybatisPlus【SpringBoot】 3 基本CRUD

MybatisPlus【SpringBoot】 【【尚硅谷】2022版MyBatisPlus教程&#xff08;一套玩转mybatis-plus&#xff09;】 3 基本CRUD 文章目录MybatisPlus【SpringBoot】3 基本CRUD3.1 BaseMapper3.2 插入3.3 删除3.3.1 通过id 删除记录3.3.2 通过id 批量删除记录3.3.3 通过map 条件…

【Svelte】-(7)绑定|Each 块绑定 / audio video 媒体标签绑定 / client offset 尺寸绑定 / this / 组件绑定

文章目录Each 块绑定媒体标签绑定尺寸绑定this组件绑定Each 块绑定 您也可以在 Each 的过程中使用。 不过需要注意的是&#xff0c;与这些 <input> 交互会改变数组。当要使用不可变数据&#xff0c;应该去避免使用这些绑定&#xff0c;并且改用事件来处理这些内容。 <…

nvm切换node版本

在实际的前端开发过程中&#xff0c;可能会经常遇见 node.js 的版本问题&#xff0c;不同的项目需要使用不同的 node.js 版本。比如Vue2和Vue3需要的Node版本不一样。 地址&#xff1a;https://github.com/coreybutler/nvm-windows/releases 注意&#xff1a;安装之前必须完…

[LCT刷题][树链信息维护] P4332 [SHOI2014]三叉神经树

写在前面 把黑题看成蓝题结果想了老半天感觉不对劲 本题对于理解SplaySplaySplay和LCTLCTLCT结构具有至关重要的意义&#xff0c;值得反复思考。 可能因为我比较菜 题目思路 题目给定一个类似神经网络的东西&#xff0c;每个节点都具有激活层、三输入单输出&#xff0c;输…

node.js+vue+Web的疫情大数据平台分析系统

以往的疫情防控管理事务处理主要使用的是传统的人工管理方式&#xff0c;这种管理方式存在着管理效率低、操作流程繁琐、保密性差等缺点&#xff0c;长期的人工管理模式会产生大量的文本文件与文本数据&#xff0c;这对事务的查询、更新以及维护带来不少困难。随着互联网时代的…

Google共码未来 与 C站 创造者的经历

本人仅参加一天活动 2022.9.14&#xff1b;吃喝拉撒全免费哈哈哈 大会主题&#xff1a;共码未来 looker、chromium、wouldnt、jetpack looker https://blog.csdn.net/WebEye_Marketing/article/details/116047404 chromium https://blog.csdn.net/arv002/article/details/1…

SEO和SEM的区别是什么,哪个效果更好一些

SEO指的是搜索引擎优化&#xff0c;SEM指的是搜索引擎影响&#xff0c;那么SEO和SEM的区别具体是什么&#xff1f;对于初创业的企业来说&#xff0c;哪个更好呢&#xff1f;下面&#xff0c;本文将介绍SEO和SEM的区别&#xff0c;帮助企业和公司网络人员理清这两者的优劣势。 S…

【力扣刷题】Day31——DP专题

文章目录七、子序列问题&#xff08;线性DP and 区间DP&#xff09;1、子序列&#xff08;不连续&#xff09;29.最长递增子序列&#xff08;LIS&#xff09;30. 最长公共子序列 &#xff08;LCS&#xff09;31.不相交的线2、子序列&#xff08;连续&#xff09;32. 最长连续递…

C语言中的指针

一。什么是指针&#xff1f; 在计算机科学中&#xff0c;指针&#xff08;Pointer&#xff09;是编程语言中的一个对象&#xff0c;利用地址&#xff0c;它的值直接指向&#xff08;points to&#xff09;存在电脑存储器中另一个地方的值。由于通过地址能找到所需的变量单元&a…

一棋盘的麦子

14天阅读挑战赛 有一个古老的传说&#xff0c;一位国王的女儿不幸落水&#xff0c;水中有很多鳄鱼&#xff0c;国王情急之下下令&#xff1a; 来&#xff0c;就把女儿嫁给他。”很多人纷纷退让&#xff0c;一个勇敢的小伙子挺身而出&#xff0c;冒着生命危险把公 一看是个穷小子…

Java程序员快速掌握前端知识

Java程序员是一个需要终身学习的岗位&#xff0c;加之技术更新迭代越来越快&#xff0c;程序员们不得不坚持提升自己&#xff0c;上班可能接触到新事物&#xff0c;下班也要抓紧时间钻研&#xff0c;才能不被时代淘汰。 前端技术&#xff0c;Java程序员可以不精通&#xff0c;…

新手如何自学python?

对于初学者来说&#xff0c;视频教程相比于书籍更加直观有效&#xff0c;可以先看视频进行学习&#xff0c;然后再看书进行深刻学习~下面就给你分享下教程以及书籍~ 网站 1. 网易公开课 https://open.163.com/ 2. 腾讯课堂 https://ke.qq.com/ 3. 中国大学慕课 https://www.…

xxl-job反序列化漏洞分析复现

01 影响范围 Xxl-Job<2.1.2&#xff0c;需要利用Hessian触发。 02 环境搭建 下载地址&#xff1a;https://github.com/xuxueli/xxl-job/releases 修改配置文件 xxl-job-2.0.1/xxl-job-admin/src/main/resources/application.properties 修改数据库信息&#xff0c;以及…

动手写数据库:实现记录管理

在数据库中&#xff0c;数据以”记录“作为一个单元来存储&#xff0c;例如一个表的“一行”就对应一条记录。假设我们有一个表叫STUDENT&#xff0c;其中有name, age, sex, class等字段&#xff0c;那么一条记录的信息就由这四个字段对应的信息合成。一条记录如何存储并不是一…

FFmpeg入门详解之110:RTSP协议讲解

RTSP亲手搭建直播点播 测试工具&#xff1a;VLC 数据源&#xff1a; 文件或本地摄像头 测试功能&#xff1a;RTSP直播点播 播放地址&#xff1a;rtsp://127.0.0.1:8554/rtspa001 服务端&#xff1a;推流 客户端&#xff1a;拉流 RTSP&#xff08;Real Time Streaming Pro…

Windows定时截屏、后台自动截屏工具,带有密码保护功能 —— 定时执行专家

目录 一、软件简介 二、使用教程 1、软件下载 2、软件的安装方法 3、无察觉自动截屏&#xff08;例如&#xff1a;间隔每 10分钟&#xff0c;执行 1次&#xff09; 一、软件简介 《定时执行专家》是一款制作精良、功能强大、简单易用、毫秒级精度、专业级的定时任务执行软…

Windows Server安全日志与系统事件变更审计

了解用户何时变更计算机内部时钟上的时间和日期。如果系统时间已变更&#xff0c;记录的事件将反映此新时间&#xff0c;而不是事件发生的实际时间。对系统时间不正确的变更可对应用程序造成严重破坏。 您可在Windows 2003 / 2008 / 2012计算机的安全日志中找到有价值信息&…