yolo后处理操作-如何获取我们想要的目标框及置信度?

yolo后处理操作-如何获取我们想要的目标框及置信度?

news/2024/5/19 7:12:39/文章来源:https://blog.csdn.net/weixin_45755332/article/details/128174203

yolo后处理就是模型的输出进行处理，得到我们想要的坐标框的 $x y w h$ 以及 $c o n f i d e n c e$
在这里插入图片描述
学习笔记

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bdB1sYQ4-1670143551092)(https://gitee.com/lizheng0219/picgo_img/raw/master/img2/image-20221204163144547.png)]

这是yolov1的模型，他将图像划分成了7x7个网格，每个网格负责预测两个边界框，每个边界框都有5个信息$x、y、w、h、confidence $ ，（这个confidence是该区域有目标框的概率），共预测20个类，每个类都有一个置信度信息（这个confidence是这个框是猫是狗的概率），所以最终输出为 $7 * 7 * 30$

在这里插入图片描述

然后每个边界框的confidence 乘以所有类别的confidence就是边界框的全概率

这样每个grid cell都能有两个20维向量，一共49个grid cell，所以共有98个向量

这些向量就组成如下的很多边界框
在这里插入图片描述
下一步就是筛选出真正的边界框

第一步：这张图片上并不是有20个类的，所以先有个阈值将大于这个阈值的类别筛选出来，比如筛选出了dog、bicycle、car
然后分别对这三个类处理，比如先对dog，从dog类的所有96个置信度进行从大到小排个序，设置一个阈值，confidence小于这个阈值的就被舍去了。

但确实还有真正包含某个物体的多个框，比如下面四个bbox的置信度都比较大，那怎么从这多个框中选择最合适的呢？

下面就是非极大抑制NMS
在这里插入图片描述
应该先将置信度最大的拿出来，然后后面的每一个都与第一个最大的作比较，如果IOU大于某个阈值，则认为两个识别了同一个物体，则把低置信度的那个抑制掉。比如bbox20和bbox47重合度较大，所以认为两个是同一物体。

如果IOU小于这个阈值，就说明两个框不是识别的同一个物体，保留。bb15和bb7与bb47的重合度较小，所以认为两个box不是同一个物体。
在这里插入图片描述

然后选取剩下的第二大置信度作为基box，其他框再与这个框比较，比如bb7和bb15重合度较大，认为这两个box内是同一个物体。
在这里插入图片描述

合适的阈值下可能只留下一个框，当然某些阈值下可能会保留更多的框，阈值的设置应该是根据目标任务设置的，越高的阈值（越不容易置零，即越宽容）会检测出越多的目标。

对其他类别也是同样操作，就得到了所有的目标框。

当然注意，在训练阶段是不需要剔除框的，所有框对我们反向传播参数更新都是有用的，只是在推理阶段需要这样做。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.luyixian.cn/news_show_230680.aspx

如若内容造成侵权/违法违规/事实不符，请联系dt猫网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

腾讯云年终选购云服务器攻略！

腾讯云年终选购云服务器攻略！

随着云计算的快速发展，很多用户都选择上云，上运中最常见的产品就是云服务器CVM和轻量应用服务器了，那么怎么选购最优惠呢，这篇文章将介绍新老用户选购腾讯云服务器的几个优惠方法。一、买赠专区第一个介绍的就是买赠专区&…

阅读更多...

MySQL下载安装运行

MySQL下载安装运行

方式1、MySQL 官方网站：http://www.mysql.com 拉到最下面： 方式2、Windows版 MySQL 的官方下载地址：https://dev.mysql.com/downloads/mysql/ 配置环境变量：在Path中添加至“\bin”（系统盘C盘）形式使用管…

阅读更多...

(02)Cartographer源码无死角解析-(33) LocalTrajectoryBuilder2D: 点云数据流向、处理、消息发布等→流程复盘

(02)Cartographer源码无死角解析-(33) LocalTrajectoryBuilder2D: 点云数据流向、处理、消息发布等→流程复盘

讲解关于slam一系列文章汇总链接:史上最全slam从零开始，针对于本栏目讲解(02)Cartographer源码无死角解析-链接如下: (02)Cartographer源码无死角解析- (00)目录_最新无死角讲解：https://blog.csdn.net/weixin_43013761/article/details/127350885 文末…

阅读更多...

我国跨国企业外汇风险管理——以海尔公司为例

我国跨国企业外汇风险管理——以海尔公司为例

目录摘要 I 一、绪论 1 （一） 选题背景及意义 1 （二） 国内研究现状 1 1． 国外研究现状 1 2． 国内研究现状 3 （三） 研究内容及方法 3 （四） 跨国企业外汇风险…

阅读更多...

java+mysql基于SSM的大学生兼职信息系统-计算机毕业设计

java+mysql基于SSM的大学生兼职信息系统-计算机毕业设计

开发环境运行环境： 开发工具:IDEA /Eclipse 数据库:MYSQL5.7 应用服务:Tomcat7/Tomcat8 使用框架:SSM(springspringMVCmybatis)vue 项目介绍论文主要是对大学生兼职信息系统进行了介绍，包括研究的现状，还有涉及的开发背景，然…

阅读更多...

构建全真互联数字地图底座腾讯地图产业版WeMap重磅升级

构建全真互联数字地图底座腾讯地图产业版WeMap重磅升级

前言 ：伴随着地理信息产业的不断演进，以及LBS、大数据、5G、云、AI等新技术的持续应用，数实融合发展呈现出加速态势，数字地图也从移动互联网时代向产业互联网时代进化。 WeMap腾讯地图产业版重磅升级！12月1日&#xff…

阅读更多...

$Python解题 - CSDN周赛第12期 - 蚂蚁的烦恼$

Python解题 - CSDN周赛第12期 - 蚂蚁的烦恼

问哥本期有幸all pass，而且用时50分钟内。不过回想起来，本期的四道题目的设计都或多或少不太严谨，或者说测试用例不够全面（后面会细说）。这样的话就极有可能造成虽然通过了测试，拿到了分数，但代…

阅读更多...

数据结构—链表

数据结构—链表

文章目录链表（头插法、尾插法、单链表反转）二分查找算法：哈夫曼编码构建链表insert()创建链表👇【1】尾插法【2】头插法【3】遍历输出链表【4】输出链表的长度【5】查找链表上是否有该元素【6】指定位置插入数据链表经典面试题【1…

阅读更多...

12家硬件厂商发布飞桨生态发行版软硬一体协同发展

12家硬件厂商发布飞桨生态发行版软硬一体协同发展

11月30日，由深度学习技术及应用国家工程研究中心主办、百度飞桨承办的WAVE SUMMIT2022深度学习开发者峰会如期举行。峰会上，百度AI技术生态总经理马艳军发布了飞桨深度学习平台的最新技术和生态进展，全新发布飞桨开源框架2.4版本，…

阅读更多...

【论文简述】 Point-MVSNet：Point-Based Multi-View Stereo Network（ICCV 2019）

【论文简述】 Point-MVSNet：Point-Based Multi-View Stereo Network（ICCV 2019）

一、论文简述 1. 第一作者：Rui Chen、Songfang Han 2. 发表年份：2019 3. 发表期刊：ICCV 4. 关键词：MVS、深度学习、点云、迭代改进 5. 探索动机：很多传统方法通过多视图光度一致性和正则化优化迭代更新&#xff…

阅读更多...

【Java实战】大厂都是怎样进行单元测试的

【Java实战】大厂都是怎样进行单元测试的

目录一、前言二、单元测试 1.【强制】好的单元测试必须遵守 AIR 原则。 2.【强制】单元测试应该是全自动执行的，并且非交互式的。测试用例通常是被定期执行的，执行过程必须完全自动化才有意义。输出结果需要人工检查的测试不是一个好的单元测试。不…

阅读更多...

清华、北大、中科大、UMA、MSU五位博士生畅聊深度学习理论

清华、北大、中科大、UMA、MSU五位博士生畅聊深度学习理论

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入！伴随着深度学习的蓬勃发展，进入人们视线的好像都是算法或AlphaGo等应用层面的东西。但是在理论上，深度学习似乎却没有很出圈的相关理论。因此，部分人也在批评深度学习是缺乏理论…

阅读更多...

蓝海创意云·11月大事记 || 12月，暖心相伴

蓝海创意云·11月大事记 || 12月，暖心相伴

秋尽冬生，日短天寒告别了立冬与小雪时光不紧不慢开启了新一月的篇章万物冬藏，沉淀酝酿站在十二月的路口蛰伏打磨，静待厚积而薄发导读 ● 客户端更新：新增PSD通道合成选项 ● 渲染案例：绝代双骄重启江湖…

阅读更多...

Reading Note(10)——AutoBridge

Reading Note(10)——AutoBridge

这篇论文是FPGA 2021年的best paper award，主要解决的是在HLS编译过程中优化布局和布线，最终达到整个multi-die的FPGA板上的大规模HLS设计时钟频率尽可能提升的目的，这篇工作在当前chiplet工艺铺展开来的当下更加有现实意义，通过这…

阅读更多...

浅谈ES标准的演变

浅谈ES标准的演变

ECMAScript从1997年第一版诞生依赖，经过无数人的“踩坑”和“填坑”，到现在，ES12呼之欲出。那么我们不妨讨论一下ES的发展历程，看它如何统一江湖，看它“曲折”而又令人期待的发展之路。最近分析typescript&#xff0c…

阅读更多...

jsp网络申报审批系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

jsp网络申报审批系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 JSP 网络申报审批系统是一套完善的web设计系统，对理解JSP java编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发，数据库为Mysql，使用…

阅读更多...

16S全长测序揭示绿头虻肠道微生物及共生细菌

16S全长测序揭示绿头虻肠道微生物及共生细菌

论文题目：Greenhead (Tabanus nigrovittatus) Wolbachia and Its Microbiome: A Preliminary Study 期刊：Microbiol Spectrum 研究背景绿头虻（Tabanus nigrovittatus）的雌虫刺吸牲畜的血液，危害家畜，是美…

阅读更多...

【从零开始学习深度学习】6.使用torchvision下载与查看图像分类数据集Fashion-MNIST

【从零开始学习深度学习】6.使用torchvision下载与查看图像分类数据集Fashion-MNIST

目录1.1 获取Fashion-MNIST数据集2.2 读取小批量小结图像分类数据集中最常用的是手写数字识别数据集MNIST。但大部分模型在MNIST上的分类精度都超过了95%。为了更直观地观察算法之间的差异，我们将使用一个图像内容更加复杂的数据集Fashion-MNIST。本节我们将使用to…

阅读更多...

分享几款免费实用的国产内网穿透工具

分享几款免费实用的国产内网穿透工具

对于没有公网IP的用户来说，如何实现远程管理或让局域网的服务可以被公网访问到是一个问题。当然，也有很多类似的需求，比如： 微信公众号小程序开发调试公网访问本地web项目异地远程处理公司服务问题异地访问公司内网财务/管理系统…

阅读更多...

什么是代码签名证书？

什么是代码签名证书？

使用代码签名证书，您可以保证签名者的身份和软件的完整性，这可以防止在下载和安装软件时出现警告。代码签名证书是软件开发人员用来签署其软件、应用程序和驱动程序代码的数字证书。它使用公私密钥基础设施(PKI)将实体绑定到公钥和私钥。申请代码签名…

阅读更多...

推荐文章

最新文章