User Tools

Site Tools


bacteriaanalysissystemjapanese

1. はじめに

BASはバイオインフォマティクスの開発、解析をサポートするPerlモジュールのひとつです。 このチュートリアルはBASを理解し、設定方法を示すものです。

2. BASの設定方法

それでは例をみていきましょう。

(1) 環境設定ファイル[BAS.conf]を開く

  $ emacs BAS.conf

* 以下は環境設定ファイルの内容になります。

###############################################
# Bacteria Analysis System configuration file>#
###############################################
#$Id: BAS.conf,v 1.6 2001/09/09 11:53:20 s98982km Exp $
#scripted by Koya Mori(mory@g-language.org)
#This is a configuration of Bacteria Analysis System
 
package G::System::BAS_conf; 
 
use strict("var"); 
 
sub BAS{ 
  my $methods; 
 
  $methods= <<'CONF'; 

##################################### 
#  G instances                      # 
##################################### 

gb1 < /pub/dnadb/ncbi/genbank/genomes/bacteria/Ecoli/ecoli.gbk 
   
##################################### 
#  CAI                              # 
##################################### 
  
>cai            N
  
G-instance      $gb

-output                 #[f or stdout] default:"stdout"

-w_output               #[f or stdout] default:"stdout"

-w_filename 
   . 
   . 
   . 
  (略) 
   . 
   . 
   .

G-languageでは10個のクラスと24個のメソッドが実装されています。

  • CAI
    • cai
  • Codon
    • codon_counter
    • amino_counter
    • codon_usage
  • Consensus
    • base_counter
    • base_information_content
    • base_z_value
    • base_entropy
    • base_relative_entropy
    • base_individual_information_matrix
  • GCskew
    • view_cds
    • find_ori_ter
    • gcskew
    • genomicskew
    • cum_gcskew
    • gcwin
  • Free Energy
    • foreach_RNAfold
  • Markov
    • over_lapping_finder
  • Over Lapping Gene
    • over_lapping_finder
  • Pat Search
    • palindrome
  • Tandem Repeat
    • foreach_tandem
    • graphical_LTR_search
  • Util
    • seq2gif
    • genome_map

(2) 解析するデータを選択する

Escherichia_coli_K12がデフォルトのデータとして選択されています。もし、他のデータを使用したい場合には、変数[gb1]を書き換える必要があります。また、下の例のように変数(例えば[mgen])を複数用意することも可能です。

* 変更前

  ##################################### 
  #  G instances                      # 
  #####################################   
  gb1 < /pub/dnadb/ncbi/genbank/genomes/bacteria/Ecoli/ecoli.gbk 

* 変更後

  ##################################### 
  #  G instances                      #
  ##################################### 
gb1 < /pub/dnadb/ncbi/genbank/genomes/bacteria/Ecoli/ecoli.gbk 
mgen < /pub/dnadb/ncbi/genbank/genomes/bacteria/Mgen/mgen.gbk    # add 

(3) メソッドを選択する

ここでは、例としてcodonクラスのメソッド[codon_usage]を使用します。まず、メソッドのスイッチをオンにするため[N]を[Y]に変更し、[G-instance]に解析するデータ(ここでは[mgen])を指定します。ファイルへ出力する場合には、[-output]のオプションに[f]を指定し、./mgen/に保存されます。同様に、グラフトとして出力する場合には[g]を指定し、./mgen/graphに保存されます。デフォルトでは[show]が指定されており、グラフを含むすべての結果が出力されます。

-output f 解析データをファイルに出力します
g グラフを出力します
show 自動的にすべての解析結果を出力します
-filename free [-output]オプションをしようすることで、ファイル名を指定できます)

* 変更前

>codon_usage    N 
G-instance      $gb 
-CDSid 
-output         show    #[f or g or show] default:"show" 
-filename 

* 変更後

>codon_usage    Y       # switch on 
G-instance      gb1     # choose data 
-CDSid 
-output         g       #[f or g or show] default:"show" 
-filename 

環境設定ファイルを保存し、BASファイルを実行します。

  $./BAS 

* 以下が標準的な出力結果になります。

               __/__/__/__/__/__/__/__/__/__/__/__/__/ 
   
                       G-language System 
   
                Version: 1.0.0 gamma 
   
                Copyright (C) 2001 G-language Project 
                Institute of Advanced Biosciences, 
                Keio University, JAPAN 
   
                   http://www.g-language.org/ 
   
               __/__/__/__/__/__/__/__/__/__/__/__/__/ 
   
    Length of Sequence :    816394 
             A Content :    249211 (30.53%) 
             T Content :    240560 (29.47%) 
             G Content :    163703 (20.05%) 
             C Content :    162920 (19.96%) 
                Others :         0 (0.00%) 
            AT Content :    59.99% 
            GC Content :    40.01% 
                             . 
                             . 
                         (Abbreviation) 
                             . 
                             . 

1.次に、出力された結果を見ていきましょう。グラフを描画する場合は以下のようにいます。

  $ cd mgen/graph 
  $ gimp codon_table.gif 
  • 解析データをファイルに出力したい場合には
  • 出力オプションを [f] に変更してください。
  • そして、ファイルを保存します。
  • 次に、BASを実行します。
  • すると、ファイルが出力されます。
  $ cd mgen
  $ emacs codon_usage.csv 

* 以下が標準的な出力結果になります。

/,taa,348,0.725 
/,tag,132,0.275 
A,gca,3759,0.386 
A,gcc,730,0.075 
A,gcg,462,0.047 
A,gct,4799,0.492 
C,tgc,295,0.203 
C,tgt,1160,0.797 
D,gac,1196,0.139 
D,gat,7388,0.861 
    . 
    . 
    . 
  (略) 
    . 
    . 
    . 

3. 注意点

[Essential]と[option]には違いがあります。[option]には名称の前に[-]がつきます(例えば-CDSid)が、[Essential]にはつきません。また、[Essential]には変数を指定しますが、[option]にはしません。

codon_usage Y

G-instance gb1 ## Essential ## -CDSid # option # -output f #[f or g or show] default:"show" # option # -filename # option #

[G-instance]は[Essential]になり、[-CDSid]、[-output]、[-output]、[-filename]は[option]になります。

bacteriaanalysissystemjapanese.txt · Last modified: 2014/01/18 07:44 (external edit)