バクテリア解析システム チュートリアル (日本語)

1 はじめに

 バクテリア解析システム(BAS)とは、バイオインフォマティクス解析に用いるさまざまなメソッドをユーザーに容易に使えるようにしたものです。ここではBASの使い方を初心者向けに解説していきます。UNIXの基本操作を理解していることを前提とします。

BASには以下の項目に関する解析手法が含まれています。(10クラス、24メソッド)

2 使い方

(1) まず始めにBAS.gcfファイルを開きましょう。

        $ emacs BAS.gcf 

(2) 次のような表示が得られるはずです。

########################################################### 
#  Bacteria Analysis System configuration file            # 
########################################################### 
#$Id: BAS.gcf,v 1.4 2001/09/11 09:40:50 s98982km dead $ 
#scripted by Koya Mori(mory@g-language.org) 
#This is a configuration of Bacteria Analysis System 
 
package G::System::BAS_conf; 
 
use strict("var"); 
 
sub BAS{ 
my $methods; 
 
$methods= <<'CONF'; 
##################################### 
#  GCF name                         # 
##################################### 
$name: BAS $ 
 
##################################### 
#  G instances                      # 
##################################### 
gb < /pub/dnadb/ncbi/genbank/genomes/bacteria/Mgen/mgen.gbk 
 
##################################### 
#  CAI                              # 
##################################### 
>cai            N       @ 
%CAI value calculater 
          
 
(途中まで抜粋) 

では、実際にGen Bank ファイルをcodon counter と GC skewにかけてみましょう。

(3)解析するゲノムファイルを指定しましょう。デフォルトでは Mycoplasma genitarium が用意されています。

##################################### 
#  G instances                      # 
##################################### 
gb < /pub/dnadb/ncbi/genbank/genomes/bacteria/Ecoli/ecoli.gbk        
original</pub/dnadb/ncbi/genbank/genomes/batteria/Bbur/bbur.gbk         # ファイルを指定する 

(4)次に解析手法を選びましょう。ここでは、例を挙げて説明するために“Codon”クラスの中の“codon_counter“を選びます。

(5)“@”の右側にcodon_counter の優先順位を記入しましょう。複数のメソッドを選択した場合、この順番に結果表示されます。

(6)そしてどのファイルを解析するのか指定します。“instance G”の右側に“original”と書きます。

(7)では、解析結果がファイルに保存されるように設定しましょう。“-output”の右側に“f”と書き込みます。   今回はvovonと名づけます。

##################################### 
#  Codon                            # 
##################################### 
>codon_counter  Y       @1 
%counting codon number 
instance_G      gb 
-CDSid 
-output         f       #[f or stdout] default:"stdout" 
-filename       vovon 
-Return 
 

##################################### 
#  GCF name                         # 
##################################### 
$name: HANZO $ 
 

以上で準備は整いました。

           $ ./BAS  
   と入力します。

aaa,32 
aac,11 
aag,3 
aat,33 
aca,7 
acc,1 
act,5 
aga,6 
agc,1 
agg,1 
agt,10 
ata,15 
atc,1 
 
(抜粋) 
ファイル名、ディレクトリ名を指定しなかった場合は、“BAS_DIR”ディレクトリの中の“codon_counter”ファイルに保存されます。

(12)では次に“GCskew”の“view_cds”を実行してみましょう。これは解析結果をグラフで見ることができます。

グラフ出力があるのは“-output”に“#[f or g or show] ”のように“g”の選択肢があるもの(View_cds、gc_win、graphical_LTR_search、seq2gif、genome_map)です。

“-output”は“show”としましょう。これで結果をすぐに表示させることができます。

##################################### 
#  GCskew                           # 
##################################### 
>view_cds               Y       @2 
%calculating atgc content around CDS 
instance_G       gb 
-length                         #default:100 
-gap                            #default:3 
-output                show     #[f or g or show] default:"show" 
-filename 
-Return       
 

先ほどcodon counter をオンにしたので、そちらの結果表示を優先させてみます。

“>view_cds”の“@”右端を“2”にしましょう。これで解析結果は1 codon counter 、2GC skew の順に表示されます。

GC skewのみを走らせたい場合は、codon counterをオフにします。オフにするには“>codon_counter”を“N”にしてください。

(13)BAS.confファイルを保存し、BASを実行します。

        $ ./BAS  
 グラフは表示されましたか?

(14)“-output”で“g”を選択した場合、出力結果はHANZOのgraphにあります。これを見るには、

        $cd  HANZO/graph 
 
        $ gimp view_cds 
と入力してください。ファイル名を指定しなかったので、view_cds がファイル名になっています。

グラフは表示されましたか?

(15)☆注意☆

BASを作動させるには、メソッドが“Y”であることとG-instance の入力が必要です。

その他はオプションですので必要に応じて利用してください。

>codon_usage    Y 
G-instance     gb1                                  ## 必須 ## 
-CDSid                                                 #  オプション # 
-output         f       #[f or g or show] default:"show    #  オプション  # 
-filename                                               #  オプション  # 
 

オプション例

それでは、あとはこのBASを使ってあなたが生命の真理を探究してみてください