文本检测DB net 实践

news/2024/4/29 15:46:29/文章来源:https://blog.csdn.net/a645061612/article/details/126934634

github 地址:GitHub - MhLiao/DB: A PyTorch implementation of "Real-time Scene Text Detection with Differentiable Binarization".

其他人的解析:DBNet阅读笔记 - 知乎

DB/DBNet:Real-time Scene Text Detection with Differentiable Binarization 一些问题 - 无左无右 - 博客园DBNet详解_lexi_qi的博客-CSDN博客_dbnet详解  (代码+解释)

论文地址:知乎 - 安全中心

由于作者用的别人框架,通过yaml文件控制加载的类和参数,这样动态生成的方式有利于实验阶段调整参数,却不利于新手快速上手。

本人在训练自己的数据集时,预测阶段结果通常会如下:

 box往上偏移并且包裹不全。在可视化训练阶段的标签时,第一张图是可视化border在原图,第二章是同时可视化gt和border在原图,默认的shrik ratio是相同的0.4,这里为了区分明显,

 class: MakeSegDetectionDatashrink_ratio: 0.2
class: MakeBorderMap shrink_ratio: 0.6

可以看到:越长的文本的标签gt的高度越小,预测阶段也是短文本效果好一点,包裹的紧密。

贴下可视化的代码, 用在 image_dataset.py的__getitem__函数返回前:

    def visualize_fun(self, data):'''想要在原图同时画出 边界图、gt图和原图时,需要设置 MakeSegDetectionData和 MakeBorderMap 的shrink ratio不一致,这样容易观察'''# cv2.imwrite('blend.jpg',(cv2.cvtColor(((data['image'].cpu().numpy().transpose(1,2,0)*255 + np.array([122.67891434, 116.66876762, 104.00698793]))).astype(np.uint8), cv2.COLOR_RGB2BGR)))# 在原图上绘制ori = (cv2.cvtColor(((data['image'].cpu().numpy().transpose(1, 2, 0) * 255 + np.array([122.67891434, 116.66876762, 104.00698793]))).astype(np.uint8),cv2.COLOR_RGB2BGR))ori[data['thresh_mask'].astype(np.bool)* (data['thresh_map']> 0.3)] = np.stack([data['thresh_map'] * 0, data['thresh_map'] * 0,data['thresh_map'] * 255], axis=-1)[data['thresh_mask'].astype(np.bool)* (data['thresh_map']> 0.3)]ori += np.repeat(np.expand_dims(data['gt'][0] * 125, axis=-1), 3, axis=-1).astype(np.uint8)cv2.imwrite('blend.jpg', ori)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_10455.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

未归一化导致Dead ReLU的悲剧

问题描述 笔者在参考http://zh.gluon.ai/chapter_deep-learning-basics/mlp-scratch.html 实现多层感知机的时候,遇到了一个问题 那就是,如果使用ReLU作为激活函数,模型的准确率非常低(只有0.1) 但是如果把那个网站上…

机器学习入门四

Octave相关资源官网地址下载地址相关语法运算符变量函数系统命令数据操作数据加载数据保存元素操作元素计算绘图和可视化工具绘图实例常用函数控制语句Octave相关资源 官网地址 官方地址 下载地址 下载地址 相关语法 运算符 %:注释~:表示不等于xo…

自学Python 62 使用urllib 包并获取百度搜索关键词中得到链接

Python 使用urllib 包 文章目录Python 使用urllib 包一、urllib 包介绍二、使用urllib.request模块三、使用urllib.parse模块在计算机网络模型中,Socket套接字编程属于底层网络协议开发的内容。虽然说编写网络程序需要从底层开始构建,但是自行处理相关协…

【图像分类】基于HOG特征结合SVM实现图像分类识别附matlab代码

1 内容介绍 ​为了满足人工智能在目标识别方法中的应用需求,需要具备对海量数据进行智能分类、识别、判读的能力.进一步挖掘了目标特性数据库数据,并将基于HOGSVM的目标识别算法应用于红外目标识别过程中.选择采集到的汽车、直升机、飞机、舰船、无人机等目标,并结合HOG算子与…

【Vite 实践】Vite 库模式能满足你吗?或许你需要统一构建

2022 年本人投入了 Vite 的怀抱,开始参与到 Vite 社区中,陆续开发了一些插件。 Vite 秉承了开箱即用,简化配置的思路,确实显著提升了前端开发体验。 但是在类库模式的构建上却有所欠缺,只能处理单个输入和单输入出的…

个人笔记--数据库理论 01 关系模型介绍——基于《数据库系统概念》第七版

关系模式 关系的例子 关系模型是目前广泛应用的数据模型由表的集合构成 例如 IDnamedpt_namesalary11111JAMCS12345 元组 tuple:表中的一行,元素无所谓属性 attribute : 原子的,不可再分的,要有属性域,如上表的nam…

云原生爱好者周刊:延迟加载任意 OCI 镜像 | 2022-09-13

开源项目推荐 SOCI Snapshotter SOCI Snapshotter 是一个 Containerd Snapshotter 插件,可以延迟加载任意 OCI 镜像,不需要 Stargz Snapshotter 一样构建特殊格式的镜像才能延迟加载。 Authentication Proxy 这个项目使用 YARP (Yet Another Reverse…

Git的认识和使用

目录 一、前置准备 二、git简介 三、gitee.com的基本使用 1.创建仓库(私库和公库) 2.创建文件及文件夹 新建文件夹两种方式 ①​ ② 3.删除 删除文件 删除仓库 四、组长组员的git使用 git clone 查看文件 git status git add git commit git push ## 命令行配置 多个…

葡聚糖-MAL/NHS/N3/Alkyne/SH/Biotin/CHO/OPSS/OH

产品名称: 葡聚糖-马来酰亚胺,葡聚糖-MAL,马来酰亚胺功能化葡聚糖 英文名称:Dextran-MAL PEG分子量可选:350,550,750,1k,2k,3.4k,5k,10k,20k(可…

[仅需1步]企业微信群机器人[0基础接入][java]

[仅需1步]企业微信群机器人[0基础接入][java]背景介绍使用测试项目背景 公司需要把日常的服务器错误抛到企业微信群中,我正好记录下使用企业微信群机器人… 介绍 企业微信群机器人 应用介绍 企业微信是腾讯微信团队打造的企业通讯与办公工具,具有与微信一致的沟…

医院检验LIS系统源码

医院lis源码 实验室信息管理系统源码 .net检验系统源码 医院系统源码 了解更多源码内容,可私信我。 开发环境:.NET4.0 WPF VS2017或VS2019SQL2016 实验室信息管理系统以条码标本为主线,实现从采集、检测、报告、归档的全程跟踪管理。 支持…

DevOps自动化测试的原则和实践

DevOps是为了在保证高质量的前提下缩短系统变更从提交到部署至生产环境的时间。在对系统进行变更时,质量很重要。高质量才能让业务价值传递到系统干系人。『自动化测试既是提高质量的一种重要手段,也是实施持续测试必需的能力,因此它是DevOps…

修改WebBrowser控件的内核解决方案

首先说一下原理 当下很大浏览器他们都是用了IE的core, 这个core只提供HTML/JS的执行和渲染,并没有给出关于界面和一些特性上的事,所以开发自己浏览器如果基于IE core需要自己完成这些内容。 一张图很好的说明了这个情况,IE浏览器的架构:http://msdn.microsoft.com/en-us/li…

nginx - 负载均衡配置-负载均衡策略

目录 知识点1:网站流量分析指标 什么是pv? 什么是uv? 什么是IP? 知识点2:正向代理和反向代理 知识点3:负载均衡实验 IP地址规划: 实验拓扑图 知识点4:负载均衡策略 1、请求…

Spring5.3学习——from 官网 day1-1

Spring5.3学习——from 官网day1-1Spring5.3学习——from 官网day1-1前言概述Spring的设计理念Spring核心:IOC什么是IOC解释IOC容器的包什么是BeanBeanFactory接口简述ApplicationContext接口简述BeanFactory源码描述以下是Bean工厂创建和销毁bean的完整生命周期流程…

Matlab论文插图绘制模板第48期—平行坐标图(Parallelplot)

​上一期文章中,分享了Matlab帕累托图的绘制模板: 这一次,再来分享一种特殊的线图:平行坐标图。 ‘平行坐标图是一种通常的可视化方法,用于对高维几何和多元数据的可视化……为了克服传统的笛卡尔直角坐标系容易耗尽空…

好心情精神心理科:80%双相情感障碍被误诊,千万注意鉴别

双相情感障碍又称躁郁症,其表现复杂,容易与其他精神疾病(包括边缘型人格障碍)相混淆,超过80%的患者未能得到正确诊断。 具体如何区分双相情感障碍与边缘型人格障碍?在回答这个问题之前,好心情精…

从规模走向规模经济,锅圈食汇回归餐饮初心

预制菜源自美国,在日本因冷链技术发展而普及。后疫情时代,预制菜在中国餐饮市场加速渗透,成为行业的新风向。 9月,第一财经与CBNData发布“Growth502022中国新消费品牌年度增长力榜单”,预制菜品牌锅圈食汇入选。 锅…

设计模式学习笔记--责任链模式

责任链模式 责任链模式是一种对象的行为模式。在责任链模式里,很多对象由每一个对象对其下家的引用而连接起来形成一条链。请求在这个链上传递,直到链上的某一个对象决定处理此请求。发出这个请求的客户端并不知道链上的哪一个对象最终处理这个请求&…

Tuxera NTFS21Mac苹果电脑读取硬盘磁盘软件

我们经常会使用移动硬盘或 U 盘进行大体积文件的分享、携带。但有时候别人提供的NTFS移动硬盘或者U 盘在 Mac 电脑中只能读取,无法将文件导入到其中。这是因为常见的 NTFS 硬盘格式在 Mac 中不能兼容。 当你从 Windows 转到了 Mac 平台,可能会发现之前用…