溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何讀懂Ka及Ks

發布時間:2021-12-10 11:15:04 來源:億速云 閱讀:288 作者:柒染 欄目:大數據

如何讀懂Ka及Ks,相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。

什么是Ka/Ks      


如何讀懂Ka及Ks

The ratio of the number of nonsynonymous substitutions per nonsynonymous site (Ka) to the number of synonymous substitutions per synonymous site (Ks)。


 

Ka/Ks表示非同義替換位點替換次數(Ka)與同義替換位點替換次數(Ks)的比值。

沒聽懂,再說一遍?




如何讀懂Ka及Ks

首先,假如你正在比對兩個物種的一對同源基因序列。進化的力量通常使得這兩條DNA序列有些差異。我們都知道密碼子有簡并性的特性,因此有的差異會導致翻譯出不同的氨基酸(非同義突變,nonsynonymous changes),有的因為同義密碼子的存在產生了相同的氨基酸(同義突變,synonymous changes)。統計出這兩條序列直接發生的非同義與同義替換的所有次數,我們就可以觀察到序列的變化情況了。接下來就是對數據做些調整了。

我已經明白了,現在有了序列的進化情況,為什么還要做調整?    


由于密碼子的簡并性,我們的序列中大概只有25%是同義突變的。假設基因并沒有受到選擇,即發生的是中性進化,基因的任何一個突變從稀有變成共有的機會是相同的,并不受其它外界因素的影響。大多數的突變的消失都是隨機的,但是我們假設種群大小是N,一個等位基因剛剛通過突變而出現在種群中,那么它在2N個等位基因的種群中固定的可能性是p=1/(2N)(詳見遺傳漂變)。

在上面的例子中,每一個突變被固定的概率是一樣的,那么發生非同義突變的可能性與發生同義突變的可能性也是一樣的。所以,在中性進化的背景下,如果我們對密碼子的簡并性進行矯正后,就應該有一種方法得出非同義突變的次數等于同義突變的次數,即Ka/Ks=1。因為Ks可以告訴我們進化的背景速度,因此偏離1的比例將告訴我們作用于蛋白上面的選擇情況。

聽起來是不是很簡單?      


很遺憾,并不是的。舉個栗子,對于編碼天冬氨酸和賴氨酸的密碼子:他們都起始于AA,賴氨酸結束于A或者G,天冬氨酸結束于T或者C。所以如果C突變成T的機率大于C突變成A或G(通常就是這樣子滴),那么第三個位置上的突變更可能是同義突變。因此許多計算Ka/Ks的方法,考慮到這部分因素,使用了的不同的轉換模型,也會使得最后的Ka/Ks值有些不同。

需要考慮兩個物種分離后的時間嗎?      


好問題!由于序列隨著時間會不斷的變化,因此我們觀察到的變化次數可能小于實際發生的變化次數。如果一個堿基最開始是A,在一個分支中,他被替換成了C,然后又被替換成了T,然后在我們的比對結果上面只能看到一次替換。同樣,可能我們看到的完全比對上位點,也可能已經替換了很多次,只不過最后變成了原來的堿基。幸運的是,實際的分歧程度可以從觀察到的總的分歧程度來估算。然而,沒有人能完美的解決這個問題:隨著變化數量的增加,來自于對齊序列的那部分信息將會減少,并逐漸接近于飽和,在這種情況下數據是沒用的,得到的結果也是不準確的。因此計算Ka/Ks時,遺傳距離較近的序列往往得到的結果更準確。

OK,我已經得到了Ka和Ks值,然后呢?      


如何讀懂Ka及Ks

Well,你現在已經有了表征蛋白進化次數的值(Ka)。假設進化選擇并不出現在silent site(發生同義突變可能性很低的位點),從進化的中性理論來看,Ks值應該與基因的突變率成正比。這是因為,假設μ是每代的中性突變率,雖然新的中性突變進入固定的概率是1 / 2N,但是它們以2Nμ的速率每代產生,因此中性進化的速率應該是2Nμ/2N = μ,這個值就是Ka所表征的。如果這樣去計算,那么Ka與Ks的比值也告訴了我們基因進化的方式。從圖中,我們發現通常Ka是小于Ks。因為改變蛋白質的突變在兩個物種之間的差異遠小于沉默的物種。也就是說,在大多數的情況下,選擇消除了有害突變,并保持蛋白質不變(即純化選擇,purifyingselection)。

在少數情況下(通常當免疫系統基因與寄生蟲共同進化時),我們發現Ka遠大于Ks(即Ka / Ks >> 1)。這是有力的證據表明選擇已經改變了蛋白質(正向選擇,positive selection)。

我明白了,如果Ka等于Ks,那么序列的進化肯定是中性的?      


沒那么簡單。中性進化是一種不可排除的可能性。但是,如果該基因的一部分(例如一個蛋白質結構域)處于正選擇狀態,而其他部分處于凈化選擇范圍內,那么你也會得到Ka/Ks等于1的結果。不過,也有很多方法可以容許進行多序列比對之后,通過考慮物種的系統發育,計算出序列中每個codon的Ka/Ks(位點模型)。另外,可以檢測基因在一個譜系中是否存在不同的比率,這表明該物種特有的事情發生了(分支模型)。這些分析方法能揭示出更多的正向選擇,提供了更多的分析方向。

該怎么把我的序列比對結果轉化成Ka/Ks值呢?      


現在已經有很多種不同的方法供我們選擇,最常用最方便的是MEGA。當然老牌的楊子恒老師的PAML也同樣十分優秀。Hyphy軟件除了提供全局的Ka/Ks計算外,也支持分支位點等各種模型,不過我比較喜歡Hyphy的一點是可以多線程計算。這些軟件的使用方法我在之后的推送中出。

看完上述內容,你們掌握如何讀懂Ka及Ks的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

ka ks
AI

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女