東大・IBMの「ワトソン」のビッグデータが読み解く「がん遺伝子」 AIが切り拓くがん治療の最先端

ドクター新潮 医療 がん

  • ブックマーク

Advertisement

富士山の高さを超える論文

 その研究は、患者の組織検体を、シークエンサー(ゲノムを読み取る装置)で処理することから始まった。

 再び宮野氏が言うには、

「次世代シークエンサーから出る生データの量は膨大です。具体的に言えば、30億文字が印刷された書類のコピー30部、900億文字がシュレッダーにかけられたと思ってください。その時に吐き出される断片は、100文字ほどの長さに切り刻まれ、山になる。がんのゲノムになると、40部ほどに増えます。解析にあたっては、前者の正常なゲノムとがんゲノムの2つ、70部のコピーを処理する必要があるので、およそ2100億文字がバラバラになる。この膨大な生データを、ジグソーパズルを完成させるように再生し、たった1文字の変異や欠損を見つけ出すことで詳細が分かるのです」

 なんとも途方もない作業だが、宮野氏はこう続ける。

「ゲノム解析の研究がここまで可能になったのは、スパコンの性能向上と、東大医学部を首席で卒業するような、超人的な若手研究者の協力があってこそ。そのような優秀な若者たちが永続的に協力できるわけではないし、ゲノム解析の結果をどう“翻訳”していくか。その壁に突き当たったのは、4年ほど前のことでした」

 せっかく苦労して得たがんゲノムのデータから、具体的な治療方法を知るためには、関連論文や薬の特許情報と紐づけなければならない。当時、対象となる論文は米国のデータベース上で2600万件、特許件数は1500万件以上あった。

「論文は長くても6ページほどですが、すべてを印刷すれば厚さ4キロ、富士山の高さを超えてしまう。論文数はがんだけで年20万のペースで指数関数的に上昇していますから、計算上2050年には大気圏外、高度100キロを超えてしまう。がんの理解は人知を超えているのです」(同)

 光明が差したのはAI「IBMワトソン」との出会い。東大医科研は2015年7月に導入したが、北米以外の医療機関で初めての例だったと宮野氏は振り返る。

「電子化された論文の要旨を読み理解し推論できる。ワトソンを凌ぐAIは、今もってありません。急性骨髄性白血病(AML)と診断されたある患者さんは、人間ドックで白血球の好酸球増多を指摘されました。医師からはAMLが疑われ、セカンドオピニオンとして東大医科研にやって来られたのですが、全ゲノムの解析は3日と7時間30分で終了し、そのうちワトソンが要した時間は僅か10分でした。ちなみに、この患者さんの体細胞変異と構造異常には、グリベックという抗がん薬が有効なのですが、臨床医の判断とワトソンの結論も見事に一致、投与は功を奏しました」

次ページ:銀行に預ける感覚

前へ 1 2 3 次へ

[2/3ページ]

メールアドレス

利用規約を必ず確認の上、登録ボタンを押してください。