東大医科研附属ヒトゲノム解析センターが生命科学分野に特化した データサイエンスコンピューティングシステム Shirokane6 を稼働ー大量解析を高速に処理可能な解析基盤の提供を実現ー
発表のポイント |
- 国立大学法人東京大学 医科学研究所 (所長:山梨 裕司/以下、東大医科研) 附属ヒトゲノム解析センター (センター長:井元 清哉/以下、HGC) は、ヒトゲノム情報の効率的な解析と個別化ゲノム医療の実現のため、最新型のデータサイエンスコンピューティングシステム Shirokane6を 2022 年 4 月 1 日より稼働しました。
- Shirokane6 の稼働により、東大医科研HGCの生命科学データサイエンス用スーパーコンピュータシステムSHIROKANE(注1)は CPU 総コア数 19,632 コア、ストレージ容量 24 PB となり、より強固な解析基盤の構築を実現しました。
- 個別化ゲノム医療の実現・新型コロナウイルスの治療法開発など、ゲノム情報を用いた研究開発が社会に果たす役割は一層重要なものとなっており、東大医科研HGCは今後もユーザ目線にたったデータ解析基盤の提供を通して生命医科学研究の発展に貢献していきます。
|
概要
- 東大医科研HGC は SHIROKANE の基盤強化のため、新世代システム Shirokane6 を 2022 年 4 月 1 日より稼働しユーザ提供を開始しました。Shirokane6 は更新前の Shirokane4 に比べ 2 倍以上のコア数の計算サーバ群を導入し、高速ストレージ容量は1.3倍以上の 24 PB を有します。稼働にあたっては前世代システムに格納されていた約 18 PBのデータの移行をおよそ 60 日間で完了しました。Shirokane6 は株式会社日立製作所が構築し、今後の安定稼働を支援します。また、新たに導入した間接蒸発式冷却装置も同時期に稼働を開始します。
-
背景・課題
近年のゲノム研究の大きな発展は、患者個人のゲノムをすべて解析し、疾患の治療に役立てる個別化ゲノム医療を強力に推し進めています。2019 年12月に厚生労働省は、「全ゲノム解析等実行計画(第1版)」を策定し、これまで治療法がなかったがんや難病患者の全ゲノムを解析し、新たな治療法や薬の開発などにつなげる姿勢を鮮明にしました。この全ゲノム解析等実行計画に基づく国家プロジェクトであるがん全ゲノム解析プロジェクトが 2021 年から開始され、全ゲノム情報の患者還元を目指したオールジャパンの研究が始まりました。この中で東大医科研は、ゲノムデータ解析を中心に重要な役割を果たしています。
さらに、新型コロナウイルスにおける重症化要因の探索や感染対策、および治療法やワクチンの開発を巡り、ゲノム解析の重要性はより広く認知されることとなり、ゲノムデータ解析研究の基盤である SHIROKANE への期待値・ニーズは、そのユーザ数や投入されるジョブ数の増加として現れています。2021年の 1年間でSHIROKANE のユーザは約 1,000 名増加しており、ピーク時には 15,000 ジョブ、2021 年の年間実行ジョブ数は 5,100 万を超えました。データ解析のニーズと利用者の急激な増加に伴い、莫大な容量のデータを安定して蓄積し解析できるよう環境基盤を強化することは東大医科研HGCにとって喫緊の課題でした。
-
今回の取り組み
2022 年 4 月に稼働を開始する Shirokane6 は、7,176 コアの計算サーバ群と 24 PB の大容量高速ストレージを有し、さらに将来のデータ増加やネットワーク増強も可能な構成を採用しました。潤沢なジョブ実行環境を備えつつ長期的なシステム計画を見据えた構成としたことで、大学・企業・研究機関など多くのユーザの研究環境を継続してサポートすることが可能となると考えています。
計算サーバ群には、SHIROKANE で実行されるジョブの特性等、これまでの運用実績を基に 1 ノード当たり 128 コアを搭載できる最新世代の CPU を採用し、高密度化することでジョブ実行効率の最大化を図りました。また、多コア・低消費電力である特徴を持ち HPC分野で発展を遂げる arm アーキテクチャを採用したCPU を搭載するサーバをSHIROKANE として初めて導入しました。従来の計算サーバ群と同じようにユーザが利用できる環境を整備し、SHIROKANE での有用性を見定める狙いもあります。
ストレージは前世代システムで安定的に稼働した超高速な分散ファイルシステムストレージを継続して採用しつつ、これまでの運用実績で負荷の高かったデータ格納用サーバ数を 1.6 倍に増強し、更なる安定稼働を図りました。また、SHIROKANE ユーザの増加に伴い年々増え続けた貴重な研究データを前世代システムから移行しました。移行に際しては、SHIROKANE ユーザが実行するゲノム解析ジョブやそのデータ I/O に影響を与えないよう配慮しつつ、18 PB を超える研究データを最大 448 並列で移行し、およそ 60 日間で完遂しています。
HGC では 2015 年に間接蒸発式冷却装置を国内で初めて導入しており、その後も省電力化したシステム運用を長年に渡り模索してきました。このたび Shirokane6 の導入時期と合わせて、モジュラー型間接蒸発冷却装置を調達し設置しました。この冷却装置は間接蒸発冷却技術により自由冷却時間を大幅に延長し自然の冷熱源を最大限に活用するものであり、国内では初導入される製品です。さらに、Shirokane6 の稼働にあわせて、SHIROKANE を冷却する際に発生する熱を建屋の館内暖房として利用可能とする取り組みもはじめます。HGCでは、常に新たな試みを取り入れ、環境負荷の軽減にも継続して寄与していきます。
-
今後の取り組み
HGCは、SHIROKANEを最先端のゲノム研究の礎とし、超高速に全ゲノムシークエンスデータをはじめとするマルチオミクスデータの解析、生命科学分野におけるデータ解析が大規模かつ高速に可能な最新のデータ解析環境と、ユーザ目線に立った質の高いサービスをこれからもSHIROKANEユーザに提供します。これにより日本の生命科学研究を大きく加速させ、個別化ゲノム医療の実現を通して医学の発展と社会に貢献していきます。
-
-
本件に関するお問い合わせ先
国立大学法人東京大学 医科学研究所 附属ヒトゲノム解析センター
教授・センター長 井元 清哉 (いもと せいや)
〒108-8639 東京都港区白金台4-6-1
TEL: 03-5449-5615
URL: http://www.ims.u-tokyo.ac.jp/imsut/jp
E-Mail: imoto@ims.u-tokyo.ac.jp
報道機関お問い合わせ先
国立大学法人東京大学 医科学研究所 国際学術連携室(広報)
〒108-8639 東京都港区白金台4-6-1
TEL: 090-9832-9760
E-Mail: koho@ims.u-tokyo.ac.jp
-
用語解説
(注1)SHIROKANEは、Shirokane3のアーカイブディスク(2015 年 1 月から運用開始)とShirokane5(2019 年 4 月から運用開始)、そしてShirokane6(2022年4から運用開始)で構成される。
PDF版はこちらよりご覧になれます(PDF:897KB)