溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

GDSC與CELL數據庫的藥物基因組學一致性實例分析

發布時間:2022-01-17 10:39:20 來源:億速云 閱讀:1206 作者:iii 欄目:大數據

這篇文章主要介紹了GDSC與CELL數據庫的藥物基因組學一致性實例分析的相關知識,內容詳細易懂,操作簡單快捷,具有一定借鑒價值,相信大家閱讀完這篇GDSC與CELL數據庫的藥物基因組學一致性實例分析文章都會有所收獲,下面我們一起來看看吧。

腫瘤細胞系藥敏數據庫,如GDSC和CELL提供了腫瘤細胞系藥敏信息和對應的基因組學信息,但是一些研究提示兩大數據庫的數據具有分歧,一些研究證實兩大數據集具有可信的一致性。


GDSC與CELL數據庫的藥物基因組學一致性實例分析

 

結果1.細胞系藥理數據集的比較

GDSC與CELL數據庫的藥物基因組學一致性實例分析  

Fig 1a: CCLE和GDSC藥物篩選數據。

  • CCLE和GDSC數據庫中存在相同的471個細胞系,并具有相關的基因組數據,但其中只有部分細胞系具有重疊的藥物篩選數據:每個化合物對應的重疊范圍為82-256個細胞系(中位數= 94;均值= 157)。

Fig 1b-1c:使用半數抑制濃度(IC50)和曲線下面積(AUC;1-AUC稱為CCLE中的活性面積)對CCLE和GDSC藥敏指標進行pearson相關性分析。全部結果見補充圖。

  • 在可以直接進行GDSC-CCLE比較的情況下,幾乎所有化合物(13/15)的AUC和IC50分布均以藥物不敏感譜系為主,而藥物敏感系則少得多?!靶√崆賵D”顯示了每種化合物的所有CCLE和GDSC AUC值的完整分布,而散點圖則展示重疊細胞系的分布。IC50值的結果與AUC的結果相似,見補充圖。幾種靶向藥物在重疊細胞系中幾乎沒有敏感性細胞系(例如,克唑替尼2個,尼洛替尼3個,TAE684 2個,厄洛替尼或索拉非尼0個)。重疊細胞系中敏感性細胞系的相對缺乏限制了兩個數據集可達到的相關水平。
GDSC與CELL數據庫的藥物基因組學一致性實例分析  

Fig 1d-1e: pearson相關性(y軸)較spearson相關性(x軸)分析的相關性更強。

  • 相關性分析的統計能力:在大多數情況下,相關分析能夠在敏感和不敏感細胞系數目之間的不平衡以及原始分析方法具有差異的情況下保持良好的一致性。
  • Haibe-kains 等人基于Spearman相關性系數計算兩數據集的相關性。
  • 將Pearson相關系數與Spearman的系數進行比較,大多數藥物的相關系數都得到了明顯提高。但是某些相關值仍然很差,這可能是由于細胞系生物學上的差異、實際藥理學測量(例如nutlin-3,紫杉醇和PHA665752),或者針對某藥物的細胞系集合僅存在一種敏感系(例如erlotinib和sorafenib)。
GDSC與CELL數據庫的藥物基因組學一致性實例分析  

Fig 1f: 使用瀑布圖對耐藥株和敏感株進行分類,并將此研究(y軸)與haibe-kains研究的Cohen’kappa系數(兩個變量的一致性系數)進行比較。

  • 在13種相關化合物中,平均94%的細胞系(CCLE= 94%,范圍= 77–100%;GDSC= 96%,范圍= 86–100%)聚集在藥物不敏感范圍(例如,大多數化合物的IC50值> 1μM)。
  • 瀑布圖分析還表明,在CCLE和GDSC數據之間,細胞系歸類為“敏感”或“抗性”的一致性很高(由cohen’kappa系數反映)。
GDSC與CELL數據庫的藥物基因組學一致性實例分析  
  • 擴展數據圖3:在所有測試藥物中,使用簡單的藥物敏感性臨界值(1μM)時,這種一致性也很明顯。
  • 瀑布圖和簡單閾值法都顯示出較haibe-kains等人研究的更高一致性,表明CCLE和GDSC細胞系藥理篩選數據適合用于建模研究,從而區分少見的藥物敏感性細胞系。
 

結果2.藥物敏感性預測指標的比較

探究CCLE和GDSC細胞系集合在何種程度上能夠闡明抗癌藥功效的常見遺傳學或分子基礎。

 

2.1 方差分析(ANOVA)

使用CCLE和GDSC上的重疊細胞系進行了方差分析(ANOVA),從而確定兩個數據集之間藥物反應的分子相關性是否一致??偣彩褂脙蓚€模型,預測變量分別為IC50或活性面積(即1-AUC)得分,兩個模型均將起源組織視為協變量,將71個癌基因的突變狀態視為獨立變量。

GDSC與CELL數據庫的藥物基因組學一致性實例分析  

Fig 2A: ANOVA分析在13個化合物(GDSC或者CELL滿足)、8個化合物(GDSC和CELL同時滿足)鑒定出與耐藥或者敏感最相關的已知基因標志。

  • 基于IC50值的ANOVA模型,兩個數據集中均發現的基因標志包括NRAS突變(對MEK抑制劑PD0325901敏感)、BRAF突變(對BRAF抑制劑PLX4720)、BCR-ABL1融合基因(對多種ABL1抑制劑敏感,如nilotinib,AZD0530)以及ERBB2擴增(對ERBB2抑制劑拉帕替尼敏感)?;诨钚栽u分和IC50的ANOVA模型結果一致,獲得兩數據集的一致性耐藥性關聯,例如對nutlin-3耐藥的TP53突變?;诨钚栽u分的ANOVA分析,GDSC的14種藥物和CCLE的15種藥物顯示出組織起源特異性的相關性,這些關聯在數據集之間是一致的(事后Welch t檢驗,見擴展數據圖5)。
 

2.2 彈性網絡回歸與嶺回歸分析

GDSC與CELL數據庫的藥物基因組學一致性實例分析擴展數據圖6:對21,013個基因組特征(包括表達,拷貝數變化和突變)進行了多變量分析,更全面地評估基因組預測因子的一致性。 

        使用每個研究可用的完整數據集或僅使用重疊數據集進行彈性網絡回歸。該分析產生了強勁的預測分子,并且預測分子的重疊非常顯著(χ2 P <10-8)。在至少一個數據集的13個化合物中,藥物反應的已知預測因子作為最相關的分子。在兩個數據集的10個化合物都顯示出這種相關性,與CCLE和GDSC各自數據集所報告的結果一致。

        對兩個數據集中重疊藥物的IC50值的彈性網絡回歸分析確定了其他預測因子。在nutlin-3敏感性的情況下,MDM2表達和TP53突變就是一個例子。在每個數據集上單獨使用彈性網模型發現的4,957個藥物基因關聯中,僅觀察到一個分歧的結果(占比0.02%,在兩數據集中具有相反的權重系數)。

GDSC與CELL數據庫的藥物基因組學一致性實例分析GDSC與CELL數據庫的藥物基因組學一致性實例分析

Fig 2B-2D:一個數據集用彈性回歸以確定預測因子,另一個數據集用嶺回歸以驗證預測因子的作用,探索確定藥物敏感性的基因組預測因子。

        CCLE和GDSC研究中確定的預測基因組特征具有高度一致性,即使對于很少有重疊細胞系的藥物也是如此。> 80%的這些特征被確定為具有一致的方向性(標準化效應同為正或同為負)。在某些情況下,初始彈性網絡回歸無法確定預測變量,這通常部分歸因于少量的藥物敏感性細胞系。另一方面,一些基于AUC或IC50表現出低相關性的藥物仍然能夠識別一致的預測因子(例如,nutlin-3)。

關于“GDSC與CELL數據庫的藥物基因組學一致性實例分析”這篇文章的內容就介紹到這里,感謝各位的閱讀!相信大家對“GDSC與CELL數據庫的藥物基因組學一致性實例分析”知識都有一定的了解,大家如果還想學習更多知識,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女