HOME 遺伝研について 研究・組織 大学院 データベース セミナー 研究会 所内情報

トップイメージ
大学院説明会
HOME > 研究・組織 > データベース運用開発研究室・高木研究室

データベース運用開発研究室・高木研究室

DDBJ業務分析およびDDBJ業務への並列分散処理技術適用研究
教  授          高木 利久          totakagi 
  DDBJは欧州EBI/EMBL、米国NCBI/GenBankと密接に連携し、国際塩基配列データベース(DB)を共同構築、運営しています。また、同時に関連する生命情報DBとその検索システムを構築、運営しています。しかし計算機の進歩速度を超えた最近のゲノム情報の増加により、従来の継続では今後のDB運営が困難になることが予想されます。本研究室ではDDBJスーパーコンピュータシステムが2012年3月にリプレースされることを視野に入れ以下を行っています。

● DDBJデータ受付・更新・公開業務および国際塩基配列DBの運営指針
 調査、検討現行業務指針を調査、再確認し、今後大容量化、複雑化する各種データに対応可能な運営方針を検討します。
● 現行の各DB、業務システムの調査、分析、改善検討
 現行システムの処理フローの調査、分析を、各種評価手法を用いて実施し、その結果をもとに業務システムの改善検討を行っています。
● 並列分散処理技術の国際塩基配列DB作成業務への適用研究
 並列分散処理技術 (Hadoop、分散KeyValueStore等)の国際塩基配列DB作成業務への適用調査を行っています。従来大型計算機で処理していたDDBJ/EMBL/Genbank の各種大規模DBデータを、データ量の増大に対応が容易なクラスタ型並列計算機上で高速処理する為の研究を行っています。

Hadoopを利用した分散データ処理のテスト

Nakazato, T., Bono, H., Matsuda,H., and Takagi, T. (2009). Gendoo: Functional profiling of gene and disease features using MeSH vocabulary Nucl. Acids Res. 37(suppl 2): W166-W169

Kaminuma, E., Kosuge, T., Kodama, Y., Aono, H., Mashima, J., Gojobori, T., Sugawara, H., Ogasawara, O., Takagi, T., Okubo, K., and Nakamura, Y. (2011). DDBJ progress report Nucl. Acids Res. 39(suppl 1): D22-D27

Kaminuma, E., Mashima, J., Kodama, Y., Gojobori, T., Ogasawara, O., Okubo, K., Takagi, T., and Nakamura, Y. (2010). DDBJ launches a new archive database with analytical tools for next-generation sequence data Nucl. Acids Res. 38(suppl 1): D33-D38

Mitsuhashi, N., Fujieda, K., Tamura, T., Kawamoto, S., Takagi, T., and Okubo, K. (2009). BodyParts3D: 3D structure database for anatomical concepts Nucl. Acids Res. 37(suppl 1): D782-D785

教 授
高木 利久
totakagi