| ゲノム規模のDNAデータを多重整列するシステムMISHIMAの開発 |
| BMC Bioinformatics誌 22, 291-297, 2010. |
| 斎藤研究室ホームページ(集団遺伝研究部門) |
MISHIMA - a new method for high speed multiple alignment of nucleotide sequences of bacterial genome scale data
Kirill Kryukov and Naruya Saitou
BMC Bioinformatics, 11. 142, 2010.
MISHIMAシステムとは、塩基配列を多重整列する新しい方法です。ClustalWなど既存の大部分の方法が採用している、系統樹を前提とした段階的整列法を用いず,配列間で共通な短いユニーク配列(1〜12塩基)を高速に発見し,それらを種として長い塩基配列をブロックに分断します。ブロック長がある長さを越えるときには,同一の探索をそのブロック内だけで行い,新しい種配列を発見してさらに分断します。このアルゴリズムは,塩基配列がお互いにきわめて近縁な場合に特に有効です。たとえば,動物の同一種内の多数個体のミトコンドリアDNAゲノムを全部配列決定したデータや,バクテリアの同一種の異なる株多数の塩基配列などに威力を発揮します。配列の長さが長く、配列数が多い時には、既存のどの方法よりも高速にしかも質の高い多重整列結果を生成します。たとえば、胃潰瘍や胃癌の原因バクテリアとして有名なヘリコバクター・ピロリ菌の6株の全ゲノム配列(それぞれおよそ170万塩基の長さ)を、パーソナルコンピュータ1台のみを用いて、わずか6時間ほどで多重整列しました。なお、MISHIMAは本研究所の位置する三島市にちなんだ名前です。
 |
MISHIMAシステムの多重整列手法と各ステップにおける計算上の複雑性。図中でO(1)はデータ量に関係なく一定時間で計算が終わることを、O(N)はデータ量Nに比例して計算時間がかかることを示します。
|
斎藤研究室ホームページ
←戻る |
|