世界を制した日本人――次世代型AIに求められる性能を探れ!

ビジネス、金融、医療など、さまざまな分野で人工知能(以下、AI)の本格活用が進む昨今、複雑で変化の激しい現実環境に柔軟に対応するために、より高度なAIが求められるようになってきています。
そんな中、2018年12月に開催された、世界的権威のある人工知能研究者の国際会議「NeurIPS」において、「Pommerman」と呼ばれるゲームを利用した興味深いコンペティションが開催されました。

AIを駆使してPommermanを攻略せよ

Pommermanは、AI同士を競わせる、コンペティション用のゲームです。
基本的なルールは、11☓11のマス目を描いた盤面上で2対2のチーム戦、合計4体のエージェントが「左、右、上、下、静止、爆弾設置」のいずれかの行動をとり、設置してから10手先で爆発する爆弾を使って、敵や障害物を破壊しながら生き残りを目指すというものです。エージェントは、競技者が開発したAIによって動かされ、勝敗を競います。

AIが把握できる盤面の状況は、自分のエージェントを中心とした一部分までで、全ての盤面情報を知ることはできません。さらにやっかいなことに、敵味方4体のエージェントの動きや、設置した爆弾の爆発によって盤面は時々刻々と変わっていってしまうのです。
このように状況を俯瞰して予測できない環境にくわえ、次の一手を考えるための時間は0.1秒しか与えられていません。設置する爆弾が爆発する10手先までの全パターンを考慮してエージェントを動かすようなことは事実上不可能なのです。

これは、今までにAIが功績を残してきたチェスや囲碁などのゲームと比較しても、はるかに難易度が高く、人間の生活に近い状況とも考えられます。たとえば車を運転していて、ボールが転がってきたら次に子どもが出てくるのではと推察しブレーキを踏む。フラフラしている自転車が前を走っていたら、急に倒れてくるのではと考え避けるための行動を準備する――。

人間は、単純な因果関係からは導き出せないことを無意識に予測し、さまざまな可能性をシミュレーションして、瞬時にアクションを決定しているのです。
そして、このような「瞬間的な予測と決定」という行為は、現実社会のさまざまな問題に対応可能な、次世代のAIに必要な要素と言えるでしょう。

IBM東京基礎研究所メンバーがPommermanコンペティションで1位&3位を獲得!

2018年のNeurIPSで開催されたPommermanコンペティションでは、IBM東京基礎研究所のメンバー2名、高橋俊博氏が優勝、同じく恐神貴行氏が3位入賞という見事な成績を収めました。

両氏は、Pommermanの本質が「居場所の奪い合い」であることに着目しました。しかし、ルールに照らしあわせると、チェスや囲碁のように、多くのパターンを検討して最適な一手を導き出すことはできません。そのため、敵は「上下左右に移動するのではなく上下左右に分裂できる」というルール以上の能力を持つと仮定した悲観的なシナリオから、次の一手を導こうと考えたのです。また、両氏が思考や手法などの開発過程を全て共有し、ともに切磋琢磨していたことも勝因の1つと言えるでしょう。

今回のアルゴリズムはまだ現実世界への適用段階にはありませんが、「不確かな状況下においても瞬時に解を導き出す」アプローチは、これからのAIの可能性を広げたことに間違いはなく、たとえば自動運転などにも役立つと考えられています。

「ゲームのコンペ」という、一般的にはどこかほのぼのとした印象を受ける話題の中で、これからの世界を大きく変えるかもしれない先進的テクノロジーが育とうとしています。今回、価値ある一歩を刻んだ高橋氏と恐神氏、そしてコンペティション参加者の方々に、あらためて大きな拍手を送ります。

photo:Getty Images