English
Top

データサイエンスとスーパーコンピューティングによる全ゲノム臨床シークエンスの実現

学友会セミナー

開催情報

開催日時 2021年3月9日(火)16:00~17:00
開催場所 ZoomによるWEB開催 聴講希望者は井元(imoto@ims.u-tokyo.ac.jp)まで連絡
講師 片山 琴絵
所属・職名 健康医療インテリジェンス分野・助教
国名 Japan
演題 データサイエンスとスーパーコンピューティングによる全ゲノム臨床シークエンスの実現
世話人 主たる世話人:渋谷 哲朗(医療データ情報学分野)
世話人:井元 清哉(健康医療インテリジェンス分野)
 

概要

近年の次世代シークエンサーを利用した革新的なゲノム解析技術の発展により、全ゲノム、トランスクリプトーム、エピゲノムなどマルチオミクスデータがシングルセルレベルででも計測できるようになってきた。加えて、我々自身のゲノム由来情報に加えて、我々に共生する微生物が炎症性腸疾患やがんのみならずパーキンソン病などの神経変性疾患やうつ病などにも関連している事が分かってきた。我々は、このようなヒトの健康や病気に関わる多種多様なデータを解析するためのデータサイエンスの技術を開発し、その大規模解析を実現するスーパーコンピューティング基盤を構築してきた。本発表では、まず、演者がこれまで取り組んできた次世代シークエンスデータの解析について説明する。希少がんである悪性骨軟部腫瘍の網羅的かつ詳細なゲノム解析には、多施設間共同研究は必須である。実例として紹介する115症例を蓄積したRNAシークエンスデータ解析は多施設共同研究によって集められたが、シークエンス解析のプラットフォームの違いによる影響などを考慮しつつ解析する必要がある。本講演では、実際に演者が直面した諸問題を紹介し、その具体的な対処法について紹介する。また、近年のシークエンス技術の大きな進歩の一つであるシングルセル解析や、腸内細菌叢のメタゲノム解析についても紹介する。
さらに、ゲノム研究の成果を臨床現場に返す臨床シークエンスにおいては、今後全ゲノム情報の活用が必須となってきており、国内外において膨大な全ゲノムシークエンスデータが、がん分野や感染症分野等においてすさまじい勢いで蓄積されている。この膨大な全ゲノムシークエンスデータをヒトゲノム解析センターのスーパーコンピュータSHIROKANEを用いて迅速にかつ詳細に解析しゲノム医療に活用するための基盤構築は喫緊の課題である。そのための取り組みとして演者らが構築しているGPUを用いた超高速シークエンスデータ解析基盤を紹介する。最後に、ゲノム解析基盤やオープンソースソフトウエアの構築技術と最新技術を組み合わせることによって実現される新しいゲノム医療に向けたデータサイエンスの可能性について、その展望を述べる。