東京大学医科学研究所

  1. ホーム
  2. イベント情報■学友会セミナー

学友会セミナー

学友会セミナー:2019年10月8日

開催日時: 2019年10月8日 17:00 ~ 18:00
開催場所: 1号館2階 2-3会議室
講師: 小井土 大
所属: 理化学研究所 生命医科学研究センター
ゲノム解析応用研究チーム・特別研究員
演題: AIからゲノミクスを学ぶ
概要:

ゲノム配列の見方を変えると、画像と同質のデータとみなすことができる。ゲノム配列のモチーフ(TATAボックスなど)はヒトが画像を認識する際の局所的特徴(目、耳…)に相当し、ATGCからなるゲノム配列を(長さ×1×4塩基)と変換すれば画像と同じ3次元配列(幅×高さ×3色)になるためである。実際、近年の画像認識を支えるDeep Convolutional Neural Network(DCNN)はゲノム配列とも相性が良く、従来の高々十塩基のモチーフ配列をヒトでは解釈困難な数十キロ塩基にまで拡張でき、臓器別の遺伝子発現量を周辺のゲノム配列のみから高精度に予測可能になった。
私は、低発現の非翻訳RNAの発現推計を目指し、転写物周辺のヒト参照ゲノム配列を入力値とした独自のAI(DCNNと勾配ブースティング木の非線形スタッキング法)を開発した。FANTOM5が収集したヒトの主要な臓器・細胞347種での発現パターンを学習した所、約半数がAUROC>0.7を達成した。本AIには集団の遺伝情報を用いていないが、学習後のin silico変異導入解析によって特定の転写物の発現確率を大きく変える(±10%)と予想された変異は、eQTL解析でも同様の効果が推計されていた(一致率90%)。こうした「AIからゲノミクスを学ぶ」概念により、現状解釈困難な非翻訳領域上の疾患感受性多型の役割解明に繋がると期待される。

世話人: 〇井上 純一郎 (分子発癌分野)
 村上 善則 (人癌病因遺伝子分野)