基于Swin Transformers的乳腺癌组织病理学图像多分类

news/2024/4/30 0:27:48/文章来源:https://blog.csdn.net/qq_47896523/article/details/137438926

乳腺癌的非侵入性诊断程序涉及体检和成像技术,如乳房X光检查、超声检查和磁共振成像。成像程序对于更全面地评估癌症区域和识别癌症亚型的敏感性较低。

CNN表现出固有的归纳偏差,并且对于图像中感兴趣对象的平移、旋转和位置有所不同。因此,通常在训练CNN模型时应用图像增强。


Swin Transformer是视觉转换器的变体,基于非重叠移位窗口的概念,是一种用于各种视觉检测任务的成熟方法。

用于分类任务的VIT实现全局自我注意力,其中计算图像补丁和所有其他补丁之间的关联。这种全局量化导致了关于补丁数量的二次计算复杂性,使得它不太适合处理高分辨率图像。Swin Transformer工作在移位的窗口上,可以提供可变的图像补丁分辨率。

为了高效建模,提出并计算局部窗口内的自注意力,并且以不重叠的方式排列窗口以均匀划分图像。基于窗口的自注意力具有线性复杂性和可扩展性。基于窗口的自注意力的建模能力是有限的,因为它缺乏跨窗口的连接。因此,提出了一种移位窗口分区方法,在连续旋转变压器块的分区配置之间交替进行,以允许跨窗口连接,同时保持非重叠窗口的高效计算。

基于乳房x光检查

在从特定感兴趣区域(ROI)进行分类时,从乳房X光片中考虑的典型特征是肿块大小、ROI的不规则形状、ROI边界的均匀性和组织密度。将这些手工制作的特征输入到支持向量机、k近邻、逻辑回归、二叉决策树和人工神经网络等分类器中进行分类。

基于超声图像检查

超声检查也是非侵入性的,基于机器学习的方法包括基于感兴趣区域的放射性特征,用于使用各种机器学习分类器进行分类。使用希尔伯特变换标记控制分水岭变换提取形状和纹理特征,并将其进一步馈送到KNN分类器和集成决策树模型。

基于组织病理学图像

非侵入性成像程序可能无法识别癌症区域及其亚型。为了弥补这一缺陷,活检被用于更多样化地研究乳腺组织中的恶性肿瘤。活检包括收集样本并在显微镜载玻片上对组织进行染色,以便更好地观察细胞质和细胞核。

BreakHis数据集

BreaKHis数据集由82例患者的乳腺肿瘤手术活检获得的7909张显微RGB图像组成,放大倍率分别为50倍、100倍、200倍和400倍。数据包括良性和恶性亚型。此外,良性癌症亚型包括纤维腺瘤、管状腺瘤、叶状瘤和腺病,而恶性亚型包括导管癌、乳头状癌、小叶癌和粘液性癌。

 Swin Transformer

准备工作

  1. 将700*640的原始图像分辨率调整为224*224
  2. 将输入尺寸为H\times W\times 3的RGB图像将原始的起始补丁大小分割成大小为4*4的小补丁
  3. 每个图象补丁的尺寸为4\times 4\times 3=48
  4. 在大小为48的原始特征张量上应用线性嵌入层,将其投影到特征维度C上

体系结构

  1.  将尺寸为C的补丁线性嵌入上应用几个具有自注意力的Swin Transformer块,保证tokens的数量为\frac{H}{4}\times \frac{W}{4},线性嵌入层与Swin Transformer一起构成Swin Transformer体系结构的第一阶段。
  2. 为了便于分层表示,从Swin Transformer Block架构的第二阶段开始,通过补丁合并层来降低补丁的数量。第二阶段的补丁合并层将每组2*2相邻补丁的特征进行拼接,并在4C维拼接特征上应用线性层。这样可以将补丁的数量减少了4倍,并且将线性层的输出维度为2C,第二阶段的输出补丁数保持在\frac{H}{8}\times \frac{W}{8}
  3. 这样的过程重复两次,构成阶段3和阶段4.导致其输出分辨率分别为\frac{H}{16}\times \frac{W}{16}\frac{H}{32}\times \frac{W}{32}

 \hat{z}^{l}=W-MHSA(LN(z^{l-1}))+z^{l-1}

z^{l}=MLP(LN(\hat{z}^{l}))+\hat{z}^{l}

\hat{z}^{l+1}=SW-MHSA(LN(z^{l}))+z^{l}

z^{l+1}=MLP(LN(\hat{z}^{l+1}))+\hat{z}^{l+1}

模型交叉验证和测试

原始数据集中图像的强度值在0 ~ 255之间,将这些强度缩放为−1和1之间的值。当包含所有缩放因子的图像时,数据集被分为62:8:30分别用于训练、验证和测试。当从特定缩放因子的图像中实现分类时,遵循72:8:20的分割。通过经验选择Swin Transformer的超参数,并使用验证集来确保模型不会过拟合。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_1046253.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何注册midjourney账号

注册Midjourney账号比较简单,准备好上网工具,进入官网 Midjourney访问地址: https://www.midjourney.com/ 目前没有免费使用额度了,会员最低 10 美元/月,一般建议使用30美元/月的订阅方案。了解如何订阅可以查看订阅…

无人机/飞控--ArduPilot、PX4学习记录(5)

这几天看dronekit,做无人机失控保护。 PX4官网上的经典案例,我做了很多注解,把代码过了一遍。 无人机具体执行了: 先起飞,飞至正上空10m->向北移动10m->向东移动10m->向南移动10m->向西移动10m->回到初…

milvus search api的数据结构

search api的数据结构 此api的功能是向量相似度搜索(vector similarity search) 一个完整的search例子: 服务端collection是一个hnsw类型的索引。 import random from pymilvus import (connections,Collection, )dim 128if __name__ __main__:connections.connect(alias…

springboot websocket 持续打印 pod 日志

springboot 整合 websocket 和 连接 k8s 集群的方式参考历史 Java 专栏文章 修改前端页面 <!DOCTYPE html> <html><head><meta charset"utf-8"><title>Java后端WebSocket的Tomcat实现</title><script type"text/javasc…

A股企业数据要素利用水平数据集(2001-2022年)

参照史青春&#xff08;2023&#xff09;的做法&#xff0c;团队对上市公司-数据要素利用水平进行测算。统计人工智能技术、区块链技术、云计算技术、大数据技术、大数据技术应用五项指标在企业年报中的披露次数&#xff0c;求和后衡量数据要素投入水平。 一、数据介绍 数据名…

贪心算法|1005.K次取反后最大化的数组和

力扣题目链接 class Solution { static bool cmp(int a, int b) {return abs(a) > abs(b); } public:int largestSumAfterKNegations(vector<int>& A, int K) {sort(A.begin(), A.end(), cmp); // 第一步for (int i 0; i < A.size(); i) { // 第二步if…

力扣HOT100 - 56. 合并区间

解题思路&#xff1a; class Solution {public int[][] merge(int[][] intervals) {// 先按照区间起始位置排序Arrays.sort(intervals, (v1, v2) -> v1[0] - v2[0]);int[][] res new int[intervals.length][2];int idx -1;for (int[] interval : intervals) {//直接加入的…

PCF8591(ADDA转换芯片)

工具 1.Proteus 8 仿真器 2.keil 5 编辑器 原理图 讲解 PCF8591是一个单片集成、单独供电、低功耗、8-bit CMOS数据获取器件。PCF8591具有4个模拟输入、1个模拟输出和1个串行IC总线接口。PCF8591的3个地址引脚A0, A1和A2可用于硬件地址编程&#xff0c;允许在同个I2C总线上接…

【实战解析】YOLOv9全流程训练至优化终极指南

【实战解析】YOLOv9全流程训练至优化终极指南 0.引言1.环境准备2.数据预处理&#xff08;1&#xff09;数据准备&#xff08;2&#xff09;按比例划分数据集&#xff08;3&#xff09;xml转txt脚本&#xff08;4&#xff09;配置文件 3.模型训练&#xff08;1&#xff09;单GPU…

【UE5 C++】各个头文件的含义

#pragma once 预处理程序指令 作用&#xff1a;保护同一个文件不会被多次包含&#xff0c;使得头文件只会被编译一次&#xff0c; #include “CoreMinimal.h” 包含了一套来自UE4的核心编程环境的普遍存在类型 #include “GameFramework/GameModeBase.h” 基于GameModeBas…

如何训练自己的ChatGPT?需要多少训练数据?

近年&#xff0c;聊天机器人已经是很常见的AI技术。小度、siri、以及越来越广泛的机器人客服&#xff0c;都是聊天机器人的重要适用领域。然而今年&#xff0c;ChatGPT的面世让这一切都进行到一个全新的高度&#xff0c;也掀起了大语言模型&#xff08;LLM&#xff09;的热潮。…

SpringBoot和Vue2项目配置https协议

1、SpringBoot项目 ① 去你自己的云申请并下载好相关文件&#xff0c;SpringBoot下载的是Tomcat&#xff08;默认&#xff09;&#xff0c;Vue2下载的是Nginx ② 将下载的压缩包里面的.pfx后缀文件拷贝到项目的resources目录下 ③ 编辑配置文件 &#xff08;主要是框里面的内…

Java项目:基于SSM+vue框架实现的人力资源管理系统设计与实现(源码+数据库+毕业论文+任务书)

一、项目简介 本项目是一套基于SSM框架实现的人力资源管理系统 包含&#xff1a;项目源码、数据库脚本等&#xff0c;该项目附带全部源码可作为毕设使用。 项目都经过严格调试&#xff0c;eclipse或者idea 确保可以运行&#xff01; 该系统功能完善、界面美观、操作简单、功能…

线程池的方式爬虫

<!--爬虫仅支持1.8版本的jdk--> <!-- 爬虫需要的依赖--> <dependency><groupId>org.apache.httpcomponents</groupId><artifactId>httpclient</artifactId><version>4.5.2</version> </dependency><!-- 爬虫需…

Spring学习(四)反射、AOP、JUnit

文章目录 Java反射回顾 AOP代理模式AOP概念及术语概述术语作用 基于注解的AOP步骤依赖配置文件切入点表达式语法切面类重用切入点表达式切面的优先级 基于XML的AOP 单元测试JUnit引入依赖JUnit5 Java反射 Spring框架的IoC基于java反射机制实现&#xff0c;反射是指在运行状态中…

antd+Vue 3实现table行内upload文件图片上传【超详细图解】

目录 一、背景 二、效果图 三、代码 一、背景 一名被组长逼着干前端的苦逼后端&#xff0c;在一个晴天霹雳的日子&#xff0c;被要求前端订单产品实现上传产品图片并立刻回显图片。 二、效果图 三、代码 <template><a-table :dataSource"dataSource" :c…

CTF之矛盾

这一题就是php的弱比较“” 这里要求输入的不是数字&#xff0c;并且输入要为1才打印flag 那我们就输入一个1后面接随便什么字符&#xff0c;因为php的弱比较将字符与数字进行比较的时候&#xff0c;会把字符转换成数字再比较&#xff0c;当转换到字符时后面便都为空了 flag{…

Android如何实现一个应用位于前台时全局页面每隔三分钟弹出一次一天最多弹出5次的GroMore半插屏广告,处于付费页和后台时停止

首先我们需要添加一个全局的Application public class MyApp extends LitePalApplication {private static final String TAG "MyApp";private static Context mContext;private boolean isManageMent;public static String oaid;Overridepublic void onCreate() {…

【opencv】示例-epipolar_lines.cpp 对极线

这段代码总的功能是使用OpenCV库进行立体视觉的估计。它从命令行读取两个图像文件名&#xff0c;使用SIFT算法检测关键点并计算这些点的描述子&#xff0c;接着通过FLANN库进行快速近似最近邻搜索来找到匹配的关键点。然后使用RANSAC方法计算基础矩阵&#xff0c;找到内点&…

Python中大的一把锁

今天可以来讲解下GIL是个什么了。 GIL为什么是Python中大的一把锁&#xff1f; GIL是Global Interpreter Lock的缩写&#xff0c;翻译过来就是全局解释器锁。 从字面上去理解&#xff0c;它就是锁在解释器头上的一把锁&#xff0c;它使Python代码运行变得有序。 假如有一段…