【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(8 月 4 日论文合集)

news/2024/5/12 2:52:24/文章来源:https://blog.csdn.net/wzk4869/article/details/132135462

文章目录

  • 一、分割|语义相关(6篇)
    • 1.1 Point2Mask: Point-supervised Panoptic Segmentation via Optimal Transport
    • 1.2 Weakly Supervised 3D Instance Segmentation without Instance-level Annotations
    • 1.3 LiDAR-Camera Panoptic Segmentation via Geometry-Consistent and Semantic-Aware Alignment
    • 1.4 ReIDTrack: Multi-Object Track and Segmentation Without Motion
    • 1.5 Focus on Content not Noise: Improving Image Generation for Nuclei Segmentation by Suppressing Steganography in CycleGAN
    • 1.6 NuInsSeg: A Fully Annotated Dataset for Nuclei Instance Segmentation in H&E-Stained Histological Images

一、分割|语义相关(6篇)

1.1 Point2Mask: Point-supervised Panoptic Segmentation via Optimal Transport

Point2掩码:基于最优传输的点监督全景分割

https://arxiv.org/abs/2308.01779

在这里插入图片描述
弱监督图像分割最近引起了越来越多的研究关注,旨在避免昂贵的像素级标记。 在本文中,我们提出了一种有效的方法,即 Point2Mask,仅使用每个目标的单个随机点注释进行训练即可实现高质量的全景预测。 具体来说,我们将全景伪掩模生成公式化为最佳传输(OT)问题,其中每个真实(gt)点标签和像素样本分别定义为标签供应商和消费者。 运输成本是通过引入的面向任务的地图来计算的,该地图侧重于各种事物和物品目标之间的类别和实例差异。 此外,提出了一种基于质心的方案来为每个gt点供应商设置准确的单元数量。 因此,伪掩码生成转化为以全局最小运输成本寻找最佳运输计划,这可以通过 Sinkhorn-Knopp 迭代来解决。 Pascal VOC 和 COCO 上的实验结果证明了我们提出的 Point2Mask 方法在点监督全景分割方面的良好性能。

1.2 Weakly Supervised 3D Instance Segmentation without Instance-level Annotations

无实例级标注的弱监督3D实例分割

https://arxiv.org/abs/2308.01721

在这里插入图片描述
随着深度学习的出现,3D语义场景理解任务取得了巨大成功,但往往需要大量手动标注的训练数据。 为了减轻标注成本,我们提出了第一个弱监督的 3D 实例分割方法,该方法只需要分类语义标签作为监督,而不需要实例级标签。 所需的语义注释可以是密集的,也可以是极其稀疏的(例如总点的 0.02%)。 即使没有任何与实例相关的基本事实,我们也设计了一种将点云分解为原始片段的方法,并找到用于学习实例质心的最有信心的样本。 此外,我们使用伪实例构建了一个重构的数据集,该数据集用于学习我们定义的多级形状感知对象信号。 采用非对称对象推理算法,以不同的策略处理核心点和边界点,生成高质量的伪实例标签来指导迭代训练。 实验表明,我们的方法可以达到与最近的完全监督方法相当的结果。 通过从分类语义标签生成伪实例标签,我们设计的方法还可以帮助现有的方法以降低注释成本来学习 3D 实例分割。

1.3 LiDAR-Camera Panoptic Segmentation via Geometry-Consistent and Semantic-Aware Alignment

基于几何一致和语义感知的激光雷达摄像机全景图像分割

https://arxiv.org/abs/2308.01686

在这里插入图片描述
3D 全景分割是一项具有挑战性的感知任务,需要语义分割和实例分割。 在此任务中,我们注意到图像可以提供丰富的纹理、颜色和辨别信息,这可以补充 LiDAR 数据以显着提高性能,但它们的融合仍然是一个具有挑战性的问题。 为此,我们提出了 LCPS,第一个激光雷达相机全景分割网络。 在我们的方法中,我们分三个阶段进行激光雷达-相机融合:1)异步补偿像素对齐(ACPA)模块,用于校准传感器之间异步问题引起的坐标未对准; 2)语义感知区域对齐(SARA)模块,将一对一的点像素映射扩展到一对多的语义关系; 3)点到体素特征传播(PVP)模块,集成了整个点云的几何和语义融合信息。 我们的融合策略比 NuScenes 数据集上仅使用 LiDAR 的基线提高了约 6.9% 的 PQ 性能。 广泛的定量和定性实验进一步证明了我们新颖框架的有效性。

1.4 ReIDTrack: Multi-Object Track and Segmentation Without Motion

ReIDTrack:无运动的多目标跟踪与分割

https://arxiv.org/abs/2308.01622

在这里插入图片描述
近年来,主流的多目标跟踪(MOT)和分割(MOTS)方法主要遵循检测跟踪范式。 基于 Transformer 的端到端(E2E)解决方案为 MOT 和 MOTS 带来了一些想法,但它们无法在主要的 MOT 和 MOTS 基准测试中实现新的最先进(SOTA)性能。 检测和关联是检测跟踪范式的两个主要模块。 关联技术主要依赖于运动和外观信息的组合。 随着深度学习最近的发展,检测和外观模型的性能迅速提高。 这些趋势让我们考虑是否可以仅基于高性能检测和外观模型来实现SOTA。 我们的论文主要基于 CBNetV2 来探索这个方向,以 Swin-B 作为检测模型,MoCo-v2 作为自监督外观模型。 运动信息和 IoU 映射在关联过程中被删除。 我们的方法在 CVPR2023 WAD 研讨会的 MOTS 赛道上获得第一名,并在 MOT 赛道上获得第二名。 我们希望我们简单有效的方法能为 MOT 和 MOTS 研究界提供一些见解。 源代码将在此git仓库下发布。

1.5 Focus on Content not Noise: Improving Image Generation for Nuclei Segmentation by Suppressing Steganography in CycleGAN

关注内容而不是噪声:通过抑制CycleGan中的隐写来改进核分割的图像生成

https://arxiv.org/abs/2308.01769

在这里插入图片描述
在显微镜图像中注释细胞核以训练神经网络是一项艰巨的任务,需要专业知识,并且会受到评估者之间和评估者内部差异的影响,尤其是在荧光显微镜中。 CycleGAN 等生成网络可以反转该过程并为给定掩模生成合成显微镜图像,从而构建合成数据集。 然而,过去的工作报告了掩模和生成图像之间的内容不一致,部分原因是 CycleGAN 通过隐藏高频图像重建的快捷方式信息来最小化其损失,而不是编码所需的图像内容并学习目标任务。 在这项工作中,我们建议通过采用基于 DCT 的低通滤波,从生成的图像中删除隐藏的快捷方式信息(称为隐写术)。 我们表明,这增加了生成的图像和循环掩模之间的一致性,并评估下游核分割任务的合成数据集。 与普通的 CycleGAN 相比,我们的 F1 分数提高了 5.4 个百分点。 将先进的正则化技术集成到 CycleGAN 架构中可能有助于缓解与隐写术相关的问题,并为细胞核分割生成更准确的合成数据集。

1.6 NuInsSeg: A Fully Annotated Dataset for Nuclei Instance Segmentation in H&E-Stained Histological Images

NuInsSeg:一种用于H&E染色组织图像核实例分割的全标注数据集

https://arxiv.org/abs/2308.01760

在这里插入图片描述
在计算病理学中,自动细胞核实例分割在整个切片图像分析中起着至关重要的作用。 虽然针对此任务提出了许多计算机化方法,但与经典机器学习和图像处理技术相比,有监督深度学习 (DL) 方法已显示出卓越的分割性能。 然而,这些模型需要完全注释的数据集进行训练,而获取这些数据集具有挑战性,尤其是在医学领域。 在这项工作中,我们发布了苏木精和曙红 (H&E) 染色组织学图像中最大的完全手动注释的细胞核数据集之一,称为 NuInsSeg。 该数据集包含 665 个图像块,其中包含来自 31 个人类和小鼠器官的 30,000 多个手动分割的细胞核。 此外,我们第一次为整个数据集提供了额外的模糊区域掩模。 这些模糊区域代表了图像中即使对于人类专家也无法进行精确且确定的手动注释的部分。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_152427.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ACL访问控制列表

ACL介绍 acl: 访问控制列表 步骤: 创建一个访问控制规则调用这个规则 ACL的分类和标识 ACL的匹配顺序以及匹配结果 拓扑图 配置 # 首先通过三层交换的实验做一次 ....## 检测ip地址 display ip interface brief## 在交换机2上做配置 [S2]acl name test ?IN…

【神经网络手写数字识别-最全源码(pytorch)】

Torch安装的方法 学习方法 1.边用边学,torch只是一个工具,真正用,查的过程才是学习的过程2.直接就上案例就行,先来跑,遇到什么来解决什么 Mnist分类任务: 网络基本构建与训练方法,常用函数解析…

【Linux命令详解 | cd命令】Linux系统中用于更改当前工作目录的命令

文章标题 简介一,参数列表二,使用介绍1. 使用cd命令切换到特定目录2. 使用cd命令与路径相关的特殊字符3. 使用cd命令切换到包含空格的目录4. 使用cd命令切换到前一个和后一个目录5. 使用cd命令切换到用户的主目录6. 使用cd命令与绝对路径和相对路径 总结…

【项目流程】前端项目的开发流程

1. 项目中涉及的所有角色及其职责 - PM 产品经理 产品经理(Product Manager,简称PM)负责明确和定义产品的愿景和战略,与客户、用户、业务部门和其他利益相关者进行沟通,收集并分析他们的需求和期望。负责制定产品的详…

TCP三次握手,四次挥手理解

1. 三次握手 *三次握手(Three-way Handshake)*其实就是指建立一个TCP连接时,需要客户端和服务器总共发送3个包。进行三次握手的主要作用就是为了确认双方的接收能力和发送能力是否正常、指定自己的初始化序列号为后面的可靠性传送做准备。实…

前端学习---vue2--选项/数据--data-computed-watch-methods-props

写在前面: vue提供了很多数据相关的。 文章目录 data 动态绑定介绍使用使用数据 computed 计算属性介绍基础使用计算属性缓存 vs 方法完整使用 watch 监听属性介绍使用 methodspropspropsData data 动态绑定 介绍 简单的说就是进行双向绑定的区域。 vue实例的数…

MPU6050

偏航角(Yaw) 横滚角(ROll) 俯仰角(Pit) 误差 mpu6050里面有一个受力的东西 受重力影响的电容 某个导体就往下一点 根据fma就可以算出当前的加速度值 加速度传感器只输出加速度 知道重力加速度和重力的角度可…

C++入门之stl六大组件--List源码深度剖析及模拟实现

文章目录 前言 一、List源码阅读 二、List常用接口模拟实现 1.定义一个list节点 2.实现一个迭代器 2.2const迭代器 3.定义一个链表,以及实现链表的常用接口 三、List和Vector 总结 前言 本文中出现的模拟实现经过本地vs测试无误,文件已上传gite…

java: 非法字符: ‘\ufeff‘

遇到这种情况是编码转换问题 解决办法: 单个文件:可以先将格式转换为utf-16,然后在转换回utf-8 多个文件:在setting-file encodings将乱码的这个文件夹里的所有Java文件都设置utf-8格式就可以了

小成本大幅度增幅CNN鲁棒性,完美的结合GLCM+CNN

本文以实验为导向,使用vgg16GLCM实现一场精彩的新冠肺炎的分类识别,并且对比不加GLCM后的效果。在这之前,我们需要弄明白一些前缀知识和概念问题: GLCM(Gray-Level Co-occurrence Matrix),中文称…

比特鹏哥-数据类型和变量【自用笔记】

这里写目录标题 1.数据类型介绍字符,整型,浮点型,布尔类型 2.signed 和unsigned3.数据类型的取值范围sizeof 展示字节大小--- 计算机中单位:字节 4.变量 常量4.1 变量创建变量(数据类型 变量名)创建变量的时…

基于react-native的简单消息确认框showModel

基于react-native的简单消息确认框showModel 效果示例图组件代码ShowModel/index.jsx使用案例device.js安装线性渐变色 效果示例图 组件代码ShowModel/index.jsx import React, {forwardRef, useImperativeHandle, useState} from react; import {View,Text,Modal,TouchableOp…

2023,哪些大厂不再值钱?

2023年,摘下口罩的第一年,虽然经济复苏没那么强劲,但对于在资本寒冬中熬了许久的互联网科技股来说,春天的步伐好像越来越近了。今年以来,主要互联网科技公司的股价基本都涨了不少,尤其美国那边,…

ROS添加发布者和订阅者机制实现

一. ROS的节点和包 ✨Node: ROS的基本单位,实现某个功能的节点。比如实现超声波传感器就是一个节点,雷达传感器就可以是一个节点 ✨Package: 多个有联系的节点组成的单位,比如你要控制无人机姿态,可能需要…

【Linux命令详解 | pwd命令】Linux系统中用于显示当前工作目录的命令

文章标题 简介一,参数列表二,使用介绍1. pwd命令的基本使用2. pwd命令中的参数3. pwd命令的工作机制4. pwd命令的实际应用 总结 简介 pwd命令是Linux中的基础命令之一,使用该命令可以快速查看当前工作目录。在掌握Linux命令时,pw…

在Raspberry Pi 4上安装Ubuntu 20.04 + ROS noetic(不带显示器)

在Raspberry Pi 4上安装Ubuntu 20.04 ROS noetic(不带显示器) 1. 所需设备 所需设备: 树莓派 4 B 型 wifi microSD 卡:最小 32GB MicroSD 转 SD 适配器 (可选)显示器,鼠标等 2. 树莓派…

CDN安全面临的问题及防御架构

CDN安全 SQL注入攻击(各开发小组针对密码和权限的管理,和云安全部门的漏洞扫描和渗透测试) Web Server的安全(运营商和云安全部门或者漏洞纰漏第三方定期发布漏洞报告修复,例如:nginx版本号和nginx resol…

Spring5.2.x 源码使用Gradle成功构建

一 前置准备 1 Spring5.2.x下载 1.1 Spring5.2.x Git下载地址 https://gitcode.net/mirrors/spring-projects/spring-framework.git 1.2 Spring5.2.x zip源码包下载,解压后倒入idea https://gitcode.net/mirrors/spring-projects/spring-framework/-/…

《数据同步-NIFI系列》Nifi配置UpdateAttribute实现字符串时间戳转日期

Nifi配置UpdateAttribute实现字符串时间戳转日期 数据处理流程如下:查询源数据库,将Avro转为Json格式,然后使用EvaluateJsonPath修改字段名,最后使用replaceText将参数组成SQL,最后PutSQL。 一、字段串时间戳导致无法插…

转运相关的征兆,大家可以来看看

转运是一种喜讯,意味着运势将逐渐好转,人生会迎来一系列积极的变化。 虽然没有确切的科学根据可以证明转运的存在, 但是在许多传统文化和民俗中,人们都相信转运的征兆是实实在在的。 虽然无法确保这些征兆会在每种情况下都适用&am…