# R語言中如何進行GO注釋和富集分析
## 引言
基因本體論(Gene Ontology, GO)注釋和富集分析是生物信息學中解析高通量數據(如轉錄組、蛋白質組)功能特征的核心方法。R語言憑借其豐富的生物信息學工具包(如`clusterProfiler`、`topGO`等),成為實現這一分析的理想平臺。本文將詳細介紹從數據準備到可視化分析的完整流程。
---
## 一、準備工作
### 1.1 安裝必要R包
```r
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install(c("clusterProfiler", "org.Hs.eg.db", "enrichplot", "DOSE"))
library(clusterProfiler)
library(org.Hs.eg.db) # 人類基因數據庫(其他物種需替換)
library(ggplot2)
# 示例基因列表(Entrez ID格式)
gene_list <- c("7157", "2353", "5970", "351", "8835", "4609")
將基因ID統一為Entrez ID(若原始數據為Symbol或其他格式):
gene_symbols <- c("TP53", "FOS", "BRCA1", "MYC", "EGFR")
gene_entrez <- mapIds(org.Hs.eg.db,
keys = gene_symbols,
keytype = "SYMBOL",
column = "ENTREZID")
使用enrichGO獲取基因的GO注釋:
go_annotation <- enrichGO(
gene = gene_list,
OrgDb = org.Hs.eg.db,
keyType = "ENTREZID",
ont = "ALL", # 可選"BP","MF","CC"
pAdjustMethod = "BH",
pvalueCutoff = 0.05,
qvalueCutoff = 0.2
)
ego <- enrichGO(
gene = gene_list,
OrgDb = org.Hs.eg.db,
keyType = "ENTREZID",
ont = "BP", # 生物過程
pAdjustMethod = "BH",
pvalueCutoff = 0.01,
qvalueCutoff = 0.05
)
查看富集結果:
head(ego@result)
關鍵列說明:
- ID: GO term編號
- Description: 功能描述
- p.adjust: 校正后的p值
- Count: 富集基因數
barplot(ego, showCategory = 15, title = "GO Biological Process")
dotplot(ego, font.size = 8)
goplot(ego)
cnetplot(ego, categorySize = "pvalue", foldChange = gene_list)
kk <- enrichKEGG(
gene = gene_list,
organism = "hsa", # 人類代碼
pvalueCutoff = 0.05
)
適用于全基因組表達數據:
gsea_result <- gseGO(
geneList = ranked_gene_list, # 需排序的基因列表
OrgDb = org.Hs.eg.db,
ont = "BP",
minGSSize = 100,
maxGSSize = 500
)
使用compareCluster:
ck <- compareCluster(
geneCluster = list(Group1 = genes1, Group2 = genes2),
fun = "enrichGO"
)
dotplot(ck)
ID轉換失敗
keyType參數是否匹配輸入ID類型bitr函數進行多步轉換富集結果為空
pvalueCutoff或qvalueCutoff可視化優化
showCategory參數控制顯示條目數ggplot2主題自定義顏色和字體通過R語言的clusterProfiler等工具包,研究者能夠高效完成GO注釋和富集分析的全流程。本文介紹的方法不僅適用于轉錄組數據,還可擴展至蛋白質組、代謝組等多組學數據分析。建議結合最新數據庫(如GO定期更新版本)和可視化技巧提升分析質量。
延伸閱讀
- Yu G, et al. (2012) clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS.
- GO Consortium (2023) The Gene Ontology knowledgebase.
”`
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。