溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

如何計算Kaks時批量提取多對基因的序列

發布時間：2022-03-10 11:03:39 來源：億速云閱讀：385 作者：小新欄目：開發技術

小編給大家分享一下如何計算Kaks時批量提取多對基因的序列，希望大家閱讀完這篇文章之后都有所收獲，下面讓我們一起去探討吧！

計算Kaks時批量提取多對基因的序列

基因家族分析中，在計算kaks時需要將每組串聯重復基因序列提取出，然后分別進行多序列比對。

我們給大家提供的腳本只能一對一對的提取序列，那數量少還可以，可如果串聯重復基因太多就有些麻煩了。這里提供一個批量提取串聯重復基因序列的腳本，可以將每組串聯重復基因序列提取到單獨的文件中。

首先我們需要準備3個文件：

1.串聯重復基因對文件。每一行是一對串聯重復基因，中間用Tab鍵分割。

如何計算Kaks時批量提取多對基因的序列

2.所有基因cds序列。

如何計算Kaks時批量提取多對基因的序列

3.一個空的目錄。

腳本運行命令如下：

perl  get_fa_by_id_kaks.pl   WRKY.tandem   ../data/Sspon.v20180123.cds.fa   test/

WRKY.tandem：串聯重復基因對文件；

../data/Sspon.v20180123.cds.fa：所有基因cds序列文件；

test/：空目錄。

get_fa_by_id_kaks.pl就是腳本了，其代碼如下：

#email: huangls@biomics.com.cn
die "perl $0 <idlist> <fa> <OUT>" unless ( @ARGV == 3 );
use Math::BigFloat;
use Bio::SeqIO;
use Bio::Seq;
$in = Bio::SeqIO->new(
        -file   => "$ARGV[1]",
        -format => 'Fasta'
);
my %gene;
while ( my $seq = $in->next_seq() ) {
        my ( $id, $sequence, $desc ) = ( $seq->id, $seq->seq, $seq->desc );
        $gene{$id} = $seq;
}
open IN, "$ARGV[0]" or die "$!";
my $n = 1;
while (<IN>) {
        chomp;
        next if /^#/;
        my @a = split /\s+/;
        my $out = Bio::SeqIO->new(
                        -file   => ">$ARGV[2]/dup_gene_paired$n.fa",
                        -format => 'Fasta'
        );
        if ( exists $gene{$a[0]} ) {
                my ( $id, $sequence, $desc ) = ( $gene{$a[0]}->id, $gene{$a[0]}->seq, $gene{$a[0]}->desc );
                my $newSeqobj = Bio::Seq->new(-seq => $sequence,
                -id =>$id,
                );
                $out->write_seq($newSeqobj);
        }
        if ( exists $gene{$a[1]} ) {
                my ( $id, $sequence, $desc ) = ( $gene{$a[1]}->id, $gene{$a[1]}->seq, $gene{$a[1]}->desc );
                my $newSeqobj = Bio::Seq->new(-seq => $sequence,
                -desc => $desc,
                -id =>$id,
                );
                $out->write_seq($newSeqobj);
        }
        $n++;
        $out->close();
}
close(IN);
$in->close();

看完了這篇文章，相信你對“如何計算Kaks時批量提取多對基因的序列”有了一定的了解，如果想了解更多相關知識，歡迎關注億速云行業資訊頻道，感謝各位的閱讀！

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
WGCNA如何獲取關系矩陣
下一篇新聞：
如何使用iTOL在進化樹中添加熱圖

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女