データベース運用開発研究室・高木研究室

ゲノム情報・バイオメディカル知識の大規模データ処理手法の研究

教員



Research Summary

遺伝研スーパーコンピュータシステムを利用したゲノム情報処理への並列分散コンピューティング技術、広域分散処理技術の適用研究を行っています。

急激に容量が増大する各種遺伝子情報解析データを処理するための技術として、ビッグデータをハンドリングするための各種並列分散処理技術(Hadoop、分散KeyValueStore等)の適用研究を行っています。また、従来共有メモリ型大型計算機で処理していた各種大規模DBデータを、データ量の増大に対応が容易なコストパフォーマンスの高い分散メモリ型クラスタ計算機上で高速処理するための研究を行っています。

Hadoopを利用した分散データ処理のテスト

Publications

Mashima, J., Kodama, Y., Fujisawa, T., Katayama, T., Okuda, Y., Kaminuma, E., Ogasawara, O., Okubo, K., Nakamura, Y., and Takagi, T. (2017). DNA data bank of Japan. Nucleic Acids Res 45, D25-D31.

Cochrane, G., Karsch-Mizrachi, I., Takagi, T., and International Nucleotide Sequence Database Collaboration. (2016). The international nucleotide sequence database collaboration. Nucleic Acids Res 44, D48-D50.

Kodama, Y., Mashima, J., Kosuge, T., Katayama, T., Fujisawa, T., Kaminuma, E., Ogasawara, O., Okubo, K., Takagi, T., and Nakamura, Y. (2014). The DDBJ Japanese Genotype-phenotype Archive for genetic and phenotypic human data. Nucleic Acids Res 43, D18-D22.