「新型コロナウイルスの遺伝子変異可視化アプリケーション」をIBMが提供――遺伝子変異を素早くフォローし、医療研究者への情報提供を

新型コロナウイルスは昨年12月に中国に発し、全世界に広がった。遺伝子変異のスピードが早く、伝播する先々で新しい型のウイルスが次から次へと生まれ、冬が近づいた今、また欧州を中心に第2波が猛威をふるい始めている。ワクチン開発への期待がますます高まる中、変異の実態を正確に把握しなければ、せっかくのワクチンも役に立たなくなる可能性がある。
IBMは、世界中で公開された新型コロナウイルスのゲノムデータを解析し、医療研究者らに遺伝子変異情報を可視化・提供するためのウェブアプリケーション“SARS-CoV-2 Variant Browser”を開発した。期間や国などの条件にあわせて、変異が起きた遺伝子上の部位などを一目で捉えることができる。伝播・感染ルートの追跡だけでなく、ワクチン開発などにも役立てることを期待している。
世界の大手IT企業の中で先んじてサイトを開発・提供できた背景には、今年1月、武漢でのウイルス発生にいち早く注目して論文を発表してきた一人の米IBM日本人ゲノム研究者と、日本IBMの研究者、開発者、そしてデザイナーが一丸となった取り組みがあった。新型コロナウイルスについて何が分かってきたのか、サイトを活用すれば何ができるのか。開発に参画したチームメンバーを代表し、徳増玲太郎(東京基礎研究所)、小山尚彦(米トーマスJワトソン研究センター)、吉田映彦(IBM Garage)、小野寺志帆(同)の4人に聞いた。
(*このインタビューは、10月上旬にWeb会議システムを介しリモートで実施しました。)

小山研究員の論文を機に開発スタート。重要なのはスピードだった

――新型コロナウイルスが猛威を振るう中で、ウェブアプリケーション「SARS-CoV-2 Variant Browser」を開発された背景や目的、サイトの特徴をお聞かせください。

徳増 IBMはCOVID-19に対応して、スーパーコンピューターの提供などさまざまな取り組みをしており、日本IBMとしても世界に貢献できればと思っていました。2月下旬、元東京基礎研究所メンバーであり、現在は米トーマスJワトソン研究センターでゲノム解析を専門にしている小山研究員が、新型コロナウイルスの遺伝子変異に関する論文を発表して研究者の間で注目されていました。そこで東京ラボ研究開発担当の森本典繁執行役員に相談し、日米の研究者・開発者などの有志が協力して遺伝子変異を可視化するウェブアプリケーションの開発を始めたのです。
最新のデータをアプリケーション側に準備することができれば、今世界でどんな遺伝子変異が起きており、どの変異の型がどの国で流行っているかなどが一目で確認できるので、ワクチン開発などの基礎データとして役立つことができると考えました。
私たちのアプリケーションは、遺伝子配列だけでなくアミノ酸レベルの変異情報まで提供することができます。医療研究者向けといっても、使い方は多岐に渡るため、さまざまな条件でデータ検索ができるようにしています。アプリケーションの開発にあたっては、同じく東京ラボに所属するIBM Garageに協力を依頼しました。

徳増玲太郎

徳増玲太郎

吉田 私たち(IBM Garage)は、ビジネス・アイデアの共創からアプリケーション作成までを短期間かつ一気通貫で行うチームです。新型コロナが流行し始めた時から、私個人としても、いち開発者として何か貢献したいと思っていたので、すぐプロジェクトに手を挙げました。私を含めIBM Garageから約10名が何らかの形でプロジェクトに貢献しています。とにかくスピードが重要なので、私たちのチームの強みとIBM Cloudを活用して、アプリケーションを迅速に立ち上げ、医療研究者の視点に立って使い勝手を工夫しています。今回の取り組みでは、4月にアプリケーション開発をはじめ、IBM Researchが研究者向けに無料提供をしているIBM Functional Genomics Platformというウェブサイトに、5月にプレビュー版をリリースしました。そして、最近10月に追加の機能などを加えて正式版をリリースしました*

吉田映彦

吉田映彦

武漢とは違うL84S型ウイルスを2月初期の段階で発見

――小山さんが新型コロナウイルスに関して発表された論文というのは、どのような内容だったのでしょうか。発表に至る背景もお聞かせください。

小山 今年1月初めごろから新型コロナウイルスの出現は関係者の間で話題になっていました。私は元製薬会社の研究者だった経験からも、過去のSARS(重症急性呼吸器症候群)やMERS(中東呼吸器症候群)と同じような脅威になるのではないか、という予感がありました。さっそくリサーチを開始し、遺伝子変異を解析するプログラムのプロトタイプを2月初旬に完成させました。
これまでに論文は3つ発表しています。2月21日にWHOに投稿(2月24日に公開)した最初の論文「COVID-19遺伝子の変異解析について」では、武漢のL型とは異なるL84S型を発見したことや、そのL84Sが主にアメリカと日本、中国の武漢以外(深圳)で広範に見つかっていることを報告しました*2-1
嬉しいことにこの論文は研究者のSNSである『ResearchGate』では、4万回以上読まれ、3月半ばには米国で最も読まれた論文になりました。L84Sの遺伝子は2カ所で変異が起きていましたが、なぜ武漢以外で見つかったのかは、いまのところ研究者の間でも不明です。また、今回の新型コロナウイルスがRaTG13という雲南州で見つかったコウモリが一番ゲノム上近く、RaTG13と共通の祖先があることは間違いありませんが、どういう経緯で人に感染したのかは解明されていません。

小山尚彦

小山尚彦

国によって致死率は100倍の差も。ウイルスの低病原性にカギか

――今回の新型コロナウイルスは変異しやすいようですが、その理由を教えていただけますか。

小山 5月に1万人の患者さんから単離したコロナウイルスのゲノムを調べたところ、6000もの変異が起きていました*2-2。ウイルスには遺伝情報物質としてDNAを持つものとRNAを持つものがありますが、コロナはRNAの1本鎖です。コロナが宿主であるヒトの細胞に入ると、RNAポリメラーゼという酵素を作ってRNAをコピーします。もともとRNAはDNAに比べて脆弱なので、その過程で変異が起きやすいのです。私たちの解析では、コロナウイルスは1年間に30回、つまり約12日ごとに1回変異します。

――感染者の致死率が国によって大きく違うことが話題になっています。これはウイルスの遺伝子変異が国によって違うからなのか、その国の民族性や生活文化の影響なのか、どう考えればよいのでしょうか。

小山 結論から言うと、その両方だと考えています。世界の平均致死率は2.7%ですが、国別では日本が1.8%、最も高いメキシコは10%です。これに対しシンガポールは0.1%未満というまさに桁違いの低さで、メキシコの100分の1しかありません。
シンガポールのコロナウイルスを解析したところ、L3606F/P13L/A4489V/T2016K など4つの変異を持った型が全体の95%を占めていました。海外からの若い労働者が感染者の大部分を占めていますが、ほかの地域の若年層の致死率に比べても低い傾向にあり、年齢だけが大きな原因ではないと推測します。人口構成や糖尿病・心疾患など基礎疾患との関係を調べても致死率の低さは説明できず、結局、L3606Fなどのウイルスがもともと低病原性ではないかと私は推論しています。これらの低病原性のウイルスを改良すれば、人に投与しても発症せず使いやすい生ワクチンを作れる可能性があるということです。また、病原性についての解明にも寄与できるのではないかと考えています。こうした解析結果をまとめてプレプリントに投稿しており、査読論文としても準備中です*

変異したウイルス株を解析し、感染ルートを追跡する

――ウイルスの遺伝子変異をデータ解析すれば、なぜ伝播・感染ルートの追跡が可能になるのでしょうか。具体的な事例をもとに分かりやすく説明していただけますか。

小山 コロナウイルスは時間が経つにつれて変異していきます。その変異を詳しく調べると、どのウイルス株から変異してきたかが推測でき、それによってウイルスの伝播ルートの追跡が可能になります。例えばニューヨークはじめ全米でまん延しているウイルスは、D614G/Q57H/T265Iという3つの変異を獲得しています。このうち最初の変異D614Gは1月の終わりに中国浙江省で獲得しました。それがどういう経路か分かりませんが、フランスに渡って2月にQ57HとT265Iの変異を獲得。それが英国経由かフランスから直接なのか分りませんが、何れにしても欧州からニューヨークに上陸したと考えられています。
日本では、アフリカ旅行をした方がD614Gのウイルスを持ち帰ってきたのではないかと考えられていますが、感染は広がりませんでした。4月の国立感染症研究所のレポートによると、その時点の日本ではシンガポールで流行している低病原性のL3606Fが大半を占めているということです。
また、最近のデータをみると、これとは別のD614G型のウイルスD614G/203_204delinsKRというイギリスではやっている型が、日本でも多くなってきているようです。

ワクチン開発では変異を絶えず見張る必要がある

――遺伝子変異のデータ解析や可視化は、ワクチンや薬剤の開発に不可欠だと思います。この面での貢献への期待をお聞かせください。

小山 コロナウイルスは、スパイクタンパクという、ウイルスのカプセルの外側に突き出たタンパク質を介して宿主の細胞に入り、増殖します。このスパイクタンパクに、免疫細胞であるB細胞が作り出す抗体がくっつくとウイルスは中和され、増殖できなくなります。そこでワクチンは、スパイクタンパクを利用してB細胞に対するトレーニングを行い、あらかじめ抗体を作っておくのです。
しかし、ワクチンを開発するには長期間かかり、一方でコロナウイルスは先ほどお話したように1年に30回も変異が起きます。スパイクタンパクに変異が起きてトレーニングしたものと違ってしまうと、抗体がくっつかなくなる可能性があります。ですから、変異の様子を注意深く見張ることは、ワクチン開発において非常に重要です。せっかく作ったワクチンが効かなければ、パンデミックは止められません。今や世界中でD614Gの株が過半数を占めています。ですからワクチンはD614Gの変異が起きたスパイクタンパクで作るのがいいと考えています*。D614G自体の変異だけであれば問題がないのかもしれませんが、Q613Hなど他の変異を同時に持った株も出てきており対応できるかは不明です。また、薬剤への耐性株が出現していないかどうかを見張ることも同じように重要です。

ウイルスの遺伝子変異や流行情報を可視化

――今回開発されたアプリケーションはコロナウイルスの遺伝子変異を、時間軸での変化や地域別の情報として提供しています。実際にどのように使うのか、サイトを見ながら説明していただけますか。

徳増 はい、それではIBM Functional Genomics Platformにログインし、SARS-CoV-2 Variant Browserの画面(図表1)に移動します。まず中央にあるウインドウですが、登録されている新型コロナウイルスの遺伝子変異の状況を俯瞰的に確認することができます。

図表1 SARS-CoV-2 Variant Browser

図表1 SARS-CoV-2 Variant Browser

詳細タブに切り替えると(図表2)、左側にウイルスサンプルが縦に並んでいることが分かるかと思います。上部に遺伝子の設計図を表示しており、背景色は遺伝子変異からみた分類を表しています。各番号のウイルスごとに、武漢で発生したウイルスに対して、遺伝子変異が起きた部位が〇で示されています。多くのウイルスで同じ部位に共通の遺伝子変異があり、その他のこまごまとした変異も起きていることが分かります。こうした情報に場所や日時を合わせて確認をすることで感染経路の推定などに役立ちます。

 図表2 変異(バリアント)の詳細

図表2 変異(バリアント)の詳細

ワクチン開発を考える上では、武漢で昨年12月に発生したウイルスではなく、現在流行しているウイルスを標的にしなければなりません。そこで、研究者は例えば「最近3カ月間で流行しており、かつスパイクタンパクに変異が起きた米国内のウイルスの状況を知りたい」というように、期間や変異した部位を入力することで、条件にあったウイルスの遺伝子変異の状況を確認することができます。

世界地図(図表1, 右上)は検索条件に合うサンプルの数を円の大きさで示しており、さらに興味のある国を選択すると、その国で流行している遺伝子型の割合を知ることができます。右下のテーブル(図表1, 右下)は、検索でヒットした遺伝子変異について、数の多い遺伝子変異を上から順に表示しています。すると、先ほどから話に出ているD614Gが大多数を占めており、ワクチン開発において検討事項となることが分かります。データをダウンロードいただき、他にスパイクタンパクで遺伝子変異が起きてないかなども確認いただくことも可能です。

大陸ごと、国ごとに、新型コロナウイルスゲノム数を時系列で表示し、変異株ごとに色分けしたグラフなどもあります。こちらは米国のケースになりますが(図表3)、グレーが特徴的な変異なし、黄色系が一時期L型S型で話題になったL84S、青色系がD614Gの変異をもつサンプルを示しています。小山が話した通り、最近はD614G変異株がほとんどで、黄色もグレーも減っているのがわかります。

図表3 米国における新型コロナウイルス変異株の遷移(SARS-CoV-2 Variant Browserより一部編集)

図表3 米国における新型コロナウイルス変異株の遷移(SARS-CoV-2 Variant Browserより一部編集)

ユーザーである医療研究者の立場で考えたアプリ

――今回、短期間でアプリを構築し、かつ医療研究者向けのソリューションとして無料提供を実現しておられます。どういった工夫やこだわりがあったのでしょうか。

吉田 私がいるIBM Garageという組織には、アプリケーション開発のためのメソドロジー(方法論)があります。今回はあくまでユーザーである医療機関の方々の視点に立って考え、短期間で開発することが必要でしたので、アジャイル開発の手法を採りました。プロトタイプを2週間ほどで作って共有し、その後、研究者の皆様からのコメントをもとに機能の改善を積み重ねながら仕上げていきました。折しもリモートワークでの開発になりましたが、WebexやSlackによるコミュニケーションはもちろん、Muralによるストリーボードの管理、GitHubによるタスク管理とカンバンによる可視化、VS Code Live Shareによるペア・プログラミング、IBM Cloud上のCI/CDツールによるデプロイの自動化など、各種ツールを駆使して効率を維持できました。

小野寺 私たちデザイナーが持つ知見やツールを、医療研究者の方々がワクチンや薬剤を開発するのに役立ててほしいという思いで取り組みました。はじめに医療研究者の普段の思考やニーズを理解し、そのユーザーに詳しいプロジェクトメンバーから定期的にどのような体験を提供できるとより効果的になるか、フィードバックをもらいました。その上でウェブサイト全体のデザインに携わり、改善を試みてきました。医療研究者がウェブサイトを訪問した際、直感的に何ができるかが伝わり、迷わずデータにアクセスでき活用できるように、IBMのデザインシステムCarbon Design Systemを採用することで、限られた時間と条件の中で、一貫したデザインを実現できたと考えています。また、デザイナーと開発者間の意思疎通にも役に立ち、協業がスムーズに行えました。今後もユーザーの求めていることを、より実現できるように改善をしていく予定です。

小野寺志帆

小野寺志帆

――SARS-CoV-2 Variant Browserの今後の普及の進め方や、追加の開発についてもお聞かせください。

徳増 今回は主に日本のチームをご紹介しましたが、SARS-CoV-2 Variant Browserは、米IBMのResearchやWatson Healthのメンバーとの協業を経て、結果的にグローバルでの取り組みとなっています。IBMはIT企業であり、ワクチンや薬剤を開発する企業ではありませんので、ITを活用した情報提供によって医療向けに少しでも貢献したいと考えています。世界で広く使っていただくために本サイトは研究者向けに無料で提供しています。
幸い、ユーザーからは前向きな反応を多くいただき、新しい機能の追加、例えば、遺伝子変異と論文情報とを組み合わせた機能なども期待をいただいております。IBMではWatson Discoveryをはじめ自然言語処理のソリューションなどが充実しているので、こういったユースケースも考えていきたいですね。
一方で、気をつけないといけないのは、このサイトで表示しているウイルスの変異情報は、あくまでも公開データベースに登録のあったゲノムになります。登録状況は国ごとに違いがあることや、実際の感染者数を反映しているわけではありません。日本の情報についての質問も多くいただきますが、私達のサイトは外部公開ができるNCBIのデータを利用しているため、海外、特に米国が主になっています。私たちの開発したウェブアプリケーション自体は、NCBIのデータ以外でも利用できますので、今後、研究者向けにアプリ自体の公開や、私たちの解析結果なども提供できればと考えています。
あとは、教育分野等でも関心が高いということで、一部機能制限がありますが、ID登録なしでも使っていただけるデモ環境も用意しました*。本取り組みを通じて新型コロナウイルスの収束に向けたお手伝いを少しでもさせていただき、穏やかな日々に戻れることを心から願っています。

TEXT:木代泰之、アイキャッチ出典:Shutterstock

-注-
*1、IBM Functional Genomics Platform:
https://ibm.biz/functional-genomics

*2、Koyama, T., D. Platt, and L. Parida, Variant analysis of SARS-CoV-2 genomes. Bull World Health Organ, 2020. 98(7): p. 495-504.
2-1:https://www.who.int/bulletin/online_first/20-253591.pdf
2-2:https://www.who.int/bulletin/volumes/98/7/20-253591/en/

*3、Koyama, T., Parida, L. Identification of a Low Pathogenicity Clade of SARS-CoV-2. Preprints 2020, 2020050466 (doi: 10.20944/preprints202005.0466.v1).
https://www.preprints.org/manuscript/202005.0466/v1

*4、Koyama, T., et al., Emergence of Drift Variants That May Affect COVID-19 Vaccine Development and Antibody Treatment. Pathogens, 2020. 9(5).
https://www.mdpi.com/2076-0817/9/5/324

*5、SARS-CoV-2 Variant Browser Demo:
https://ibm.biz/sars-cov-2-variant-browser-demo