バクテリア解析システム(BAS)とは、バイオインフォマティクス解析に用いるさまざまなメソッドをユーザーに容易に使えるようにしたものです。ここではBASの使い方を初心者向けに解説していきます。UNIXの基本操作を理解していることを前提とします。
BASには以下の項目に関する解析手法が含まれています。(10クラス、24メソッド)
(1) まず始めにBAS.gcfファイルを開きましょう。
$ emacs BAS.gcf
(2) 次のような表示が得られるはずです。
###########################################################
# Bacteria Analysis System configuration file #
###########################################################
#$Id: BAS.gcf,v 1.4 2001/09/11 09:40:50 s98982km dead $
#scripted by Koya Mori(mory@g-language.org)
#This is a configuration of Bacteria Analysis System
package G::System::BAS_conf;
use strict("var");
sub BAS{
my $methods;
$methods= <<'CONF';
#####################################
# GCF name #
#####################################
$name: BAS $
#####################################
# G instances #
#####################################
gb < /pub/dnadb/ncbi/genbank/genomes/bacteria/Mgen/mgen.gbk
#####################################
# CAI #
#####################################
>cai N @
%CAI value calculater
(途中まで抜粋)
では、実際にGen Bank ファイルをcodon counter と GC skewにかけてみましょう。
(3)解析するゲノムファイルを指定しましょう。デフォルトでは Mycoplasma genitarium が用意されています。
##################################### # G instances # ##################################### gb < /pub/dnadb/ncbi/genbank/genomes/bacteria/Ecoli/ecoli.gbk original</pub/dnadb/ncbi/genbank/genomes/batteria/Bbur/bbur.gbk # ファイルを指定する
(4)次に解析手法を選びましょう。ここでは、例を挙げて説明するために“Codon”クラスの中の“codon_counter“を選びます。
(6)そしてどのファイルを解析するのか指定します。“instance G”の右側に“original”と書きます。
##################################### # Codon # ##################################### >codon_counter Y @1 %counting codon number instance_G gb -CDSid -output f #[f or stdout] default:"stdout" -filename vovon -Return
##################################### # GCF name # ##################################### $name: HANZO $
$ ./BASと入力します。
aaa,32 aac,11 aag,3 aat,33 aca,7 acc,1 act,5 aga,6 agc,1 agg,1 agt,10 ata,15 atc,1 (抜粋)
(12)では次に“GCskew”の“view_cds”を実行してみましょう。これは解析結果をグラフで見ることができます。
グラフ出力があるのは“-output”に“#[f or g or show] ”のように“g”の選択肢があるもの(View_cds、gc_win、graphical_LTR_search、seq2gif、genome_map)です。
“-output”は“show”としましょう。これで結果をすぐに表示させることができます。
##################################### # GCskew # ##################################### >view_cds Y @2 %calculating atgc content around CDS instance_G gb -length #default:100 -gap #default:3 -output show #[f or g or show] default:"show" -filename -Return
先ほどcodon counter をオンにしたので、そちらの結果表示を優先させてみます。
“>view_cds”の“@”右端を“2”にしましょう。これで解析結果は1 codon counter 、2GC skew の順に表示されます。
GC skewのみを走らせたい場合は、codon counterをオフにします。オフにするには“>codon_counter”を“N”にしてください。
(13)BAS.confファイルを保存し、BASを実行します。
$ ./BASグラフは表示されましたか?
(14)“-output”で“g”を選択した場合、出力結果はHANZOのgraphにあります。これを見るには、
$cd HANZO/graph
$ gimp view_cds
と入力してください。ファイル名を指定しなかったので、view_cds がファイル名になっています。
グラフは表示されましたか?
(15)☆注意☆
BASを作動させるには、メソッドが“Y”であることとG-instance の入力が必要です。
その他はオプションですので必要に応じて利用してください。
>codon_usage Y G-instance gb1 ## 必須 ## -CDSid # オプション # -output f #[f or g or show] default:"show # オプション # -filename # オプション #
オプション例
| -output | f | データをファイルに保存する |
| g | 結果をグラフ表示させる | |
| show | 解析結果を自動的に表示させる | |
| -filename | 使うときはファイル名を記入する |