R语言生存分析可视化分析

news/2024/5/9 0:57:38/文章来源:https://blog.csdn.net/tecdat/article/details/128102231

生存分析指的是一系列用来探究所感兴趣的事件的发生的时间的统计方法。

生存分析被用于各种领域,例如:

癌症研究为患者生存时间分析,

“事件历史分析”的社会学

在工程的“故障时间分析”。

在癌症研究中,典型的研究问题如下:

某些临床特征对患者的生存有何影响?

个人三年存活的概率是多少?

各组患者的生存率有差异吗?

 

 视频:R语言生存分析原理与晚期肺癌患者分析案例

R语言生存分析Survival analysis原理与晚期肺癌患者分析案例

最近我们被客户要求撰写关于生存分析的研究报告,包括一些图形和统计输出。

基本概念

在这里,我们从定义生存分析的基本术语开始,包括:

生存时间和事件

生存函数和风险函数

癌症研究中的生存时间和事件类型

有不同类型的事件,包括:

复发

死亡

观察开始到观察终止的时间通常称为生存时间(或事件发生的时间)。

癌症研究中两个最重要的评价方法包括:i)死亡时间;和ii)无复发存活时间,其对应于治疗反应与疾病复发之间的时间。它也被称为无病生存时间和无事件生存时间

如上所述,生存分析侧重于直到发生感兴趣事件(复发或死亡)的期望持续时间。

Kaplan-Meier生存评估

Kaplan-Meier(KM)方法是一种非参数方法,用于估计观察到的生存时间的生存概率(Kaplan和Meier,1958)。

生存曲线是管理生存概率与时间的关系曲线,它提供了一个有用的数据总结,可以用来估计诸如中位生存时间之类的衡量指标。

R生存分析

生存分析总结和可视化生存分析结果

示例数据集

我们将使用生存包中提供的肺癌数据。

head(lung)inst time status age sex ph.ecog ph.karno pat.karno meal.cal wt.loss
1    3  306      2  74   1       1       90       100     1175      NA
2    3  455      2  68   1       0       90        90     1225      15
3    3 1010      1  56   1       0       90        90       NA      15
4    5  210      2  57   1       1       90        60     1150      11
5    1  883      2  60   1       0      100        90       NA       0
6   12 1022      1  74   1       1       50        80      513       0

inst:机构代码

时间:以天为单位的生存时间

状态:状态1 =审查,2 =死亡

年龄:年龄

性别:男= 1女= 2

ph.ecog:ECOG表现评分(0 =正常 5 =死亡)

ph.karno:Karnofsky表现评分(差 = 0 正常= 100)由医师评定

pat.karno:Karnofsky表现评分由患者评估

膳食:餐时消耗的卡路里

wt.loss:过去六个月的体重下降

计算生存曲线:survfit()

我们要按性别来计算生存概率。

函数survfit()可以被用来计算Kaplan-Meier生存估计。

使用函数Surv()创建的生存对象

要计算生存曲线,请输入以下内容:

print(fit)n events median 0.95LCL 0.95UCL
sex=1 138    112    270    212    310
sex=2  90    53    426    348    550

默认情况下,函数print()显示生存曲线的摘要。它显示观察数,事件数量,中位数生存和中位数的置信区间。

如果要显示生存曲线的更完整摘要,请输入以下内容:

# 生存曲线摘要
summary(fit)# 
summary(fit)$table

可视化生存曲线

我们 生成两组受试者的生存曲线。

ggplot(fit,pval = TRUE, conf.int = TRUE,risk.table = TRUE, # 添加风险表risk.table.col = "strata", # 按组更改风险表颜色

legend.labs更改图例标签。

ggplot(fit,                     # 具有计算统计信息的survfit对象。pval = TRUE,             # 显示对数秩检验的p值。conf.int = TRUE,         # 显示生存曲线点估计的置信区间。conf.int.style = "step",  # 自定义置信区间样式xlab = "Time in days",   # 自定义X轴标签。break.time.by = 200,     # 以200的时间间隔打断X轴。ggtheme = theme_light(), # 使用主题自定义绘图和风险表。risk.table = "abs_pct",  # 绝对数值

每组的中位生存时间表示生存概率S(t)为0.5的时间。

使用参数xlim可以缩短生存曲线范围,如下所示:

请注意,可以使用参数fun指定三个经常使用的转换:

 

累积风险是常用来估计风险概率。

 

Kaplan-Meier生命表:生存曲线的总结

如上所述,您可以使用函数summary()来获得生存曲线的完整摘要:

summary(fit)

 

Log-Rank检验比较生存曲线:survdiff()

数秩检验是比较两条或更多条生存曲线的最广泛使用的方法。零假设是两组在生存期间没有差异。 

可以使用survdiff()如下:


surv_diffN Observed Expected (O-E)^2/E (O-E)^2/V
sex=1 138      112    91.6      4.55      10.3
sex=2  90      53    73.4      5.68      10.3
Chisq= 10.3  on 1 degrees of freedom, p= 0.00131

存活率差异的对数秩检验给出p = 0.0013的p值,表明性别组在存活方面差异显着。

 复杂的生存曲线

在本节中,我们将使用多个因素的组合计算生存曲线。接下来,我们将使用ggsurvplot()输出结果

ggplot(fit,conf.int = TRUE,risk.table.col = "strata", # 按组更改风险表颜色ggtheme = theme_bw(), # 更改ggplot2主题

可视化输出。下面的图显示了性别变量根据rx&adhere的值的生存曲线。

 

概要

生存分析是一组数据分析的统计方法,其中感兴趣的结果变量是事件发生之前的时间。

在这篇文章中,我们演示了如何使用两个R软件包来执行和可视化生存分析)。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_39024.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux redict 输入输出重定向 详细使用方法 文件描述符

Linux redict 重定向 Linux 重定向 在 Linux 系统中,我们需要输入和输出让系统与外部进行交互,比如在我们使用鼠标、键盘等输入设备时其实就是通过输入的方式让数据进行系统中。而系统输出一般就会打印在显示器上、刻录光盘等等。而我们要讲的重定向也…

(二)DepthAI-python相关接口:OAK Pipeline

消息快播:OpenCV众筹了一款ROS2机器人rae,开源、功能强、上手简单。来瞅瞅~ 编辑:OAK中国 首发:oakchina.cn 喜欢的话,请多多👍⭐️✍ 内容可能会不定期更新,官网内容都是最新的,请查…

Meta-learning

基本理解 meta learning翻译为元学习,也可以被认为为learn to learn 元学习与传统机器学习的不同在哪里? 元学习与传统机器学习, 这里举个通俗的例子,拿来给大家分享? 把训练算法类比成学生在学校学习,传…

【华为上机真题 2022】字符串分隔

🎈 作者:Linux猿 🎈 简介:CSDN博客专家🏆,华为云享专家🏆,Linux、C/C、云计算、物联网、面试、刷题、算法尽管咨询我,关注我,有问题私聊! &…

[附源码]计算机毕业设计springboot环境保护宣传网站

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

后端存储实战课总结(上)

创建和更新订单 表设计 最少应该有以下几张表: 订单主表:保存订单基本信息订单商品表:保存订单中的商品信息订单支付表:保存订单支付和退款信息订单优惠表:保存订单的优惠信息 订单主表和字表是一对多关系&#xf…

1.1 统计学习方法的定义与分类

统计学习方法的定义与分类统计学习的概念统计学习的定义统计学习运用到的领域统计学习的步骤统计学习的分类统计学习的概念 统计学习的定义 统计学习 (Statistical Machine Learning) 是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。 以计…

第五站:操作符(终幕)(一些经典的题目)

目录 一、分析下面的代码 二、统计二进制中1的个数 解一:(求出每一个二进制位,来统计1的个数) 解二:(利用左我们移或右移操作符和按位与) 解三:(效率最高的解法&…

【iOS】—— GET和POST以及AFNetworking框架

GET和POST以及AFNetworking框架 文章目录GET和POST以及AFNetworking框架GET和POSTGET和POST区别GETGET请求步骤GET请求代码POSTPOST请求步骤POST请求代码AFNetworking简介添加头文件GETGET方法GET方法参数GET方法代码样例POSTPOST方法第一种:第二种:先来…

C++:STL之Vector实现

vector各函数 #include<iostream> #include<vector> using namespace std;namespace lz {//模拟实现vectortemplate<class T>class vector{public:typedef T* iterator;typedef const T* const_iterator;//默认成员函数vector(); …

Netty进阶——粘包与半包(代码示例)

目录一、消息粘包和消息半包的概述1.1、消息粘包1.2、消息半包二、粘包现象代码示例2.1、粘包现象服务端示例代码2.2、粘包现象客户端示例代码2.3、分别启动服务端&#xff0c;客户端&#xff0c;查看服务端结果输出三、半包现象代码示例3.1、半包现象服务端示例代码3.2、半包现…

【强化学习论文】小样本策略泛化的提示决策转换器

文献题目&#xff1a;Prompting Decision Transformer for Few-Shot Policy Generalization 摘要 人类可以利用先前的经验并从少量演示中学习新任务。与旨在通过更好的算法设计实现快速适应的离线元强化学习相比&#xff0c;我们研究了架构归纳偏差对少样本学习能力的影响。我…

不懂单链表? 这篇文章就帮你搞明白

坚持看完&#xff0c;结尾有思维导图总结 链表对指针的操作要求不低链表的概念链表的特性链表的功能(最重要)定义和初始化头插头删细节说明尾插尾删寻找链表元素与打印链表在 某位置后插入删除在某位置的插入删除销毁链表链表的概念 什么是链表 官方概念&#xff1a;链表是一种…

显卡---显卡驱动---CUDA---Cudnn

1. 背景 最近在follow百度的CAE这篇论文时&#xff0c;源码需要的环境为&#xff1a; python 3.7 cuda: 11.0 cudnn: 8.0.4 gcc 8.2 该版本要求与我目前使用的服务器上的CUDA版本不相符合。因此搜索了一篇国外小哥的文章&#xff0c;讲述了如何在一台服务器上安装多个CUDA和Cud…

Node之Express学习笔记

一.Express 1.1什么是Express Express的作用和Node.js内置的http模块类似 专门用来创建Web服务器的 本质&#xff1a;npm上的第三方包&#xff0c;提供快速创建Web服务器的便捷方法 1.2Express能做什么 Web网站服务器&#xff1a;专门提供Web网页资源的服务器 API接口服务器&…

FPGA----ZCU106基于axi-hp通道的pl与ps数据交互(全网唯一最详)

1、大家好&#xff0c;今天给大家带来的内容是&#xff0c;基于AXI4协议的采用AXI-HP通道完成PL侧数据发送至PS侧&#xff08;PS侧数据发送至PL侧并没有实现&#xff0c;但是保留了PL读取PS测数据的接口&#xff09; 2、如果大家用到SoC这种高级功能&#xff0c;那大家应该对于…

Linux进阶-进程间通信(ipc)

进程间通信&#xff1a;数据传输、资源共享、事件通知、进程控制。 Linux系统下的ipc 早期unix系统 ipc&#xff1a;管道&#xff08;数据传输&#xff09;、信号&#xff08;事件通知&#xff09;、fifo&#xff08;数据传输&#xff09;。 system-v ipc&#xff08;贝尔实…

Kubernetes之Pod初始化容器

Kubernetes之Pod初始化容器 概述 ​ 初始化是很多编程语言普遍关注的问题&#xff0c;甚至有些编程语言直接支持模式构造来生成初始化程序&#xff0c;这些用于进行初始化的程序结构称为初始化器或初始化列表。初始化代码要首先运行&#xff0c;且只能运行一次&#xff0c;它们…

CAPM资产定价模型

本文是Quantitative Methods and Analysis: Pairs Trading此书的读书笔记。 CAPM(Capital Asset Pricing Model)资产定价模型 这个模型在金融界的影响就是beta这个词的使用。CAPM模型用两个部分的回报之和来解释一个资产的回报。其中一个部分是指市场&#xff08;称为market)…