2628_main

人工知能が急速に進化し始めた。カーネギーメロン大学のTome Michell教授は、「コンピューターはこれまで人間の言語をほとんど理解できなかったが、今後10年でかなり理解できるようになるだろう」と、人工知能が急速な進化のフェーズに入ったことを示唆している。
急速に進化し始めた理由は2つある。1つは、コンピューターが大量のデータを扱えるようになったから。もう1つは、人間の脳を模した仕組みが実際に機能するようになってきたからだ。
変化はまた、チャンスでもある。
人工知能の進化は今、どこまで進んでいるのだろうか。それがどのような領域に、イノベーションを起こすのだろうか。日本を代表する新進気鋭の人工知能研究者、東京大学准教授の松尾豊氏に聞いた。

精度を上げるためのしっかりとした進歩

人工知能の1つ目の急速な進化の背景には、近年コンピューターが扱えるデータ量が爆発的に増加したことがある。例えば、インターネット上のwebサイトを見て回るだけでも、ネット上には情報があふれていることが分かる。そこに普及したのがスマートフォンだ。誰もがネットを介して情報をやり取りするようになった。企業も、これまで紙で行っていた業務を次々とデジタル化している。
そして今後は、各種センサーが身の回りにあふれる時代になる。気象情報、交通情報、さらには身体情報まで、あらゆるデータが集計され、解析可能になる。

データ量が爆発的に増えることで、コンピューターが活躍できる領域はますます多岐にわたり、コンピューターはさらに精度を高める。
その代表例がIBMのコンピューターだろう。IBMのコンピューター「Deep Blue」は1997年に、当時のチェス世界チャンピオンのガルリ・カスパロフに勝利している。また同じくIBMの「Watson」は、2011年に米人気クイズ番組「Jeopardy!」に出演、人間のクイズ王と対戦し、見事優勝。賞金100万ドルを獲得している。

東京大学の松尾豊准教授はIBMのこうした取り組みについて、「純粋にすごいと思います」と感心する。
IBMのWatsonがすごいのは、自然言語処理に優れているところだ。コンピューターが扱えるデータが爆発的に増えているといっても、今はまだ紙に書かれた情報が山のようにある。書籍をスキャナーで読み取って、文字を認識したとしても、コンピューターには、その書籍の内容がどういうものなのかは理解できない。どの部分が書籍のタイトルで、どれが著者名かということさえも、そのままでは分からない。

ところがWatsonは、コンピューター向けに作られていない文字情報を、コンピューターに理解できるような形に変えるところで、さまざまな工夫がされているのだという。クイズ番組「Jeopardy!」に出演したWatsonは、書籍や、百科事典、Wikipedia上の情報など、2億ページ分のテキストデータ(70GB程度、約100万冊の書籍に相当)をスキャンして取り込んでいた。

松尾准教授は、「Watsonの研究者の講演を聞かせてもらったことがありますが、答えを出す速さや精度を上げるために、さまざまな工夫をしているようです。精度をちょっと上げるだけでも、細かいルールをたくさん作らなければならないので大変なはず。大きな進歩が見て取れます」と絶賛する。

IBM Watsonは、「コグニティブ・システム」というまさに新しいコンピューティングの時代への第一歩を象徴するものだ。プログラムによるコンピューティングに加え、「自然言語の処理」、「仮説の生成と評価」、そして「自己学習と能動的な知識の蓄積」という、他に類を見ない3つの機能を備えている。今では世界で最も有名なクイズ・ゲームに挑戦したコンピューターというだけでなく、さまざまな業界で利用されるようになった。

例えば、ニューヨークのSloan-Kettering記念癌センター(Memorial Sloan-Kettering Cancer Center)では、Watsonのテクノロジーを使い60万件の医療エビデンス、150万人の患者記録、200万ページ分の医療論文を読み込んでいるが、Watsonが処理するデータは、大半がコンピューター処理を想定せずに書かれた文書だという。同センターでは、それらのデータと患者の個人的症状、遺伝子情報、家族及び本人の病歴などのデータを照らし合わせて診断し、1人ひとりに最適の治療方法を提案する仕組みを開発しているという。

Deep Learningで「表現を獲得」

そして2つ目の人工知能の急速な進化のきっかけとなったのが、「Deep Learning」と呼ばれる技術的なブレークスルーだ。そこが松尾准教授の専門領域なので、詳しく聞いてみた。

――Deep Learningとは、どういうものでしょうか。

松尾豊氏松尾 Deep Learningは50年来のブレークスルーだと思います。50年来越えられなかった壁に「表現を獲得する」ということがあったのですが、Deep Leaningが、それを解決する手がかりを与えてくれたのです。

――「表現の獲得」とは、どういう意味ですか。

松尾 これまでのコンピューティングは、データを扱うときにデータを前処理して変数に直します。その前処理によって、その後の処理の精度が大幅に変わってくるのです。人間の場合はそれを無意識にやっている。視覚にしろ、聴覚にしろ、それ以外のデータにしても、人間の場合は、なんとなくここが重要だということを、つかんでしまうわけです。

例えば画像の場合、画像の中から特徴量を自動的に切り出すことができる。特徴量とは、簡単なものだと、エッジの検出、角の検出、などのようなものから始まり、それが組み合わさることによって「顔がある」「これは人間の顔」「これは猫の顔」などという高次の特徴量へとつながっていく。そうすることで高次の特徴量も自動的に取り出すことができるのです。

――どういう仕組みで、高次の特徴量をつかんでいくのですか。

松尾 オートエンコーダーというものを使います。従来の機械学習なら、「教師あり学習」、「教師なし学習」という分け方をすることが多かったのですが、Deep Learningは「教師なし学習だが、一見すると教師あり学習」のような扱いをするのです。
どういうことかと言うと、例えばコンピューターに画像のデータを与えた場合、コンピューターは画像の一部を消して、その一部を残った部分から当てなさいという問題に変えるのです。そうすると、画像を与えただけで、たくさんの擬似的問題を作ることができる。それをニューラル・ネットワークで解かせていくと、ニューラル・ネットワークの隠れ層にあたる部分に特徴量が自動的に獲得されてくるという仕組みです。そして、それは画像の一部を見て、残りを当てるということにおいて重要な特徴量なので、画像を端的に表わす特徴量が自動的に選ばれるというわけです。

――ちょっと整理させてください(笑)。
例えば「1」という数字の画像をコンピューターに与えたとします。コンピューターはその画像の一部を消して、自分で自分に問題を出す。そしてそれを解くのが、コンピューターの中のニューラル・ネットワーク。つまり人間の脳の神経回路網のような仕組みというわけですね。

例えば「1」の画像の下半分を隠して、ニューラル・ネットワークに推測させたとします。ニューラル・ネットワークの1つの回路は、隠れた部分を、右に傾いた線と推測するかもしれないし、別の回路は左に傾いた線と推測するかもしれない。くねくね曲がった線と推測する回路もあるでしょう。そして下にまっすぐ伸びた線であると推測した回路が正解となって、その回路が得点する。

それで画像の隠す部分を変えて幾つも問題を作り、正解した回路に点を与え続けていって、最も得点が高い回路がつかんでいる画像の特徴、つまり「1」の場合だと、「まっすぐに下に伸びた線」という特徴が、この画像の特徴だと認識する。
そして次にまったく別の画像を見せた場合、線が下にまっすぐ伸びていたら、「これは1の可能性松尾豊氏がある」と判断する。そういう仕組みということでしょうか。

松尾 そうです。「1」という一連の縦棒があるかどうか、というのが特徴量として自動的に検出される仕組みです。

――これって人間の脳も同じことをやっていますよね。例えばこのドアの向こうは、ひょっとすると断崖絶壁かもしれない。だからドアを開ける前に、大丈夫か推測する。でも何度も大丈夫だという経験を積むことで、安心してドアを開けることができるようになる。

松尾 そういうことです。人間の赤ちゃんは、1歳半から2歳くらいで急に言葉を覚え始めますよね。それまで赤ちゃんの脳が何もしていないわけではなく、2歳までに着々と概念を獲得しているのだと思います。大人に教えられなくても概念をつかんでいる。前処理しているわけです。その前処理の仕組みを、人工知能ではDeep Learningと呼んでいるわけです。

text:湯川鶴章(ITジャーナリスト)

後編はこちらから

松尾 豊氏

まつお・ゆたか
松尾 豊

東京大学大学院工学系研究科准教授
1975年、香川県生まれ。97年東京大学工学部卒業。2002年東京大学大学院工学系研究科電子情報工学博士課程修了。工学博士。産業技術総合研究所研究員、スタンフォード大学言語情報研究センター客員研究員などを経て07年より現職。シンガポール国立大学客員准教授を兼務。14年9月より人工知能学会倫理委員会委員長。共著に『東大准教授に教わる「人工知能って、そんなことまでできるんですか?」』


Sponsor Content Presented ByIBM

※日本IBM社外からの寄稿や発言内容は、必ずしも同社の見解を表明しているわけではありません。


関連記事