這篇“如何用R語言進行KM生存分析”文章的知識點大部分人都不太理解,所以小編給大家總結了以下內容,內容詳細,步驟清晰,具有一定的借鑒價值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“如何用R語言進行KM生存分析”文章吧。
R是數據分析常用的軟件之一,通過各種功能強大的R包,可以簡單方便的實現各種分析。在R語言中,能夠進行生存分析的R包很多,survival和survminer是其中最基本的兩個,survival負責分析,survimner負責可視化,二者相結合,可以輕松實現生存分析。具體過程如下
對于每個個體而言,其生存數據會出現兩種情況,第一種是觀測到生存時間,通常用1表示,第二種則是刪失。通常用0表示。survival自帶了一個測試數據lung
每一行代表一個樣本,time表示生存時間,status表示刪失情況,這里只有1和2兩種取值,默認排序后的第一個level對應的值為刪失,這里則為1表示刪失。其他列為樣本對應的性別,年齡等基本信息。
這里根據性別這個二分類變量,采用KM算法來估計生存曲線,代碼如下(summary結果只顯示部分)
> library("survival") > library("survminer") > kmfit<-survfit(Surv(time, status) ~ sex, data = lung) > summary(kmfit) Call: survfit(formula = Surv(time, status) ~ sex, data = lung) sex=1 time n.risk n.event survival std.err lower 95% CI upper 95% CI 11 138 3 0.9783 0.0124 0.9542 1.000 12 135 1 0.9710 0.0143 0.9434 0.999 13 134 2 0.9565 0.0174 0.9231 0.991 15 132 1 0.9493 0.0187 0.9134 0.987 26 131 1 0.9420 0.0199 0.9038 0.982 30 130 1 0.9348 0.0210 0.8945 0.977
從kmfit中summary可以看到已經包含了每個時間點的生存概率,刪失等信息,通過這些信息,完全可以自己寫代碼來畫圖。為了方便,我們直接采用survminer中的函數來進行可視化。
最基本的可視化方式如下
library("survminer") ggsurvplot(kmfit, pval = TRUE, conf.int = TRUE, risk.table = TRUE, risk.table.col = "strata", linetype = "strata", surv.median.line = "hv", ggtheme = theme_bw(), palette = c("#E7B800", "#2E9FDF"))
以上就是關于“如何用R語言進行KM生存分析”這篇文章的內容,相信大家都有了一定的了解,希望小編分享的內容對大家有幫助,若想了解更多相關的知識內容,請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。