機械学習と次世代シークエンス技術の活用により日本人集団の白血球の血液型を解明

Press Release

Genetic and phenotypic landscape of the MHC region in the Japanese population.

Jun Hirata, Kazuyoshi Hosomichi, Saori Sakaue, Masahiro Kanai, Hirofumi Nakaoka, Kazuyoshi Ishigaki, Ken Suzuki, Masato Akiyama, Toshihiro Kishikawa, Kotaro Ogawa, Tatsuo Masuda, Kenichi Yamamoto, Makoto Hirata, Koichi Matsuda, Yukihide Momozawa, Ituro Inoue, Michiaki Kubo, Yoichiro Kamatani, Yukinori Okada,*. (* 責任著者)

Nature Genetics Published: 28 January 2019 DOI:10.1038/s41588-018-0336-0

プレスリリース資料

大阪大学 大学院医学系研究科の平田潤 大学院生、岡田随象 教授(遺伝統計学)らの研究グループは、次世代シークエンス技術と機械学習を用いて、日本人集団における白血球の血液型が11パターンで構成されており、その個人差が、病気や量的形質を含む50以上の表現型に関わっていることを明らかにしました。

ヒトの血液に含まれる白血球には血液型が存在し、ヒトゲノム上のHLA遺伝子の配列の個人差で決定されます。白血球の血液型は移植医療や個別化医療※7に際して重要ですが、HLA遺伝子構造が複雑で解読に専門技術が必要なことや高額な実験費用により、HLA遺伝子配列の詳細な個人差の解明は遅れていました。

岡田教授らの研究グループは、最先端のゲノム配列解読技術である次世代シークエンス技術を駆使して、日本人集団1,120名を対象に33のHLA遺伝子におけるゲノム配列を決定することに成功しました。得られたHLA遺伝子ゲノム配列情報に対して機械学習手法であるtSNEを適用した結果、日本人集団の白血球の血液型を11パターンの組み合わせに分類可能なことが明らかになりました。これは、複雑なヒトゲノム情報の解釈を、機械学習手法を用いて実現した先進的な成功例と評価することができます。

さらに研究グループは、日本人集団17万人のゲノムデータを対象に、白血球の血液型をコンピューター上で高精度に推定することに成功しました。推定された血液型パターンに基づき、多彩な表現型との関連を調べるフェノムワイド関連解析を実施しました。その結果、50以上の表現型において、白血球の血液型が発症に関与していることが明らかになりました。

本研究成果により、日本人集団における白血球の血液型の全容が解明されました。機械学習による白血球の血液型の分類に成功したことは、生命科学研究における機械学習の画期的な応用例と考えられます。さらに、白血球の血液型を用いた個別化医療の実現に貢献するものと期待されます。

本研究成果は、英国科学誌「Nature Genetics」に、1月29日(火)午前1時(日本時間)に公開されます。

Figure1

図:機械学習と次世代シークエンス技術の活用により、日本人集団における白血球の血液型の個人差の全容が明らかとなった。


  • Twitter
  • facebook
  • youtube