【悲報】Google DeepMindのAI、「裏切り」の有益性を発見する

ポスト ツイート シェア はてブ LINEで送る コメント

遠くない将来、私たち人類はAIに裏切られることになるかもしれません。詳細は以下から。

AIが人類に反旗を翻す。「ターミネーター」や「マトリックス」など、これまで繰り返し描かれてきたSFのテーマのひとつです。しかしAIの急速な発達に伴い、現実的な問題として私たち人類の前に立ちはだかる事になるかも知れません。

Google DeepMindが開発したAIの「AlphaGo」は2016年3月に人類最強クラスの棋士イ・セドルさんを4勝1敗で破り、年末には「Master」と称する改良型AlphaGoがネット上の囲碁サイトで並み居る世界のトップ棋士たちを60戦全勝という圧倒的な強さでなぎ倒しました。

謎の囲碁棋士「Master」こと「改良型AlphaGo」、世界のトップ棋士を相手に60戦全勝 | BUZZAP！（バザップ！）

もはや囲碁ですら人類はAIに勝てないというSFじみた世界が既に到来している訳ですが、そんなGoogle DeepMindのAIが「裏切り」の有益性に気付いてしまったという怖いニュースが飛び込んできました。

Google DeepMindの社内研究によると、AIはリソース不足に陥った際には「裏切り」行為を行うことが有益であると判断し、実際にそのように振る舞うとのこと。

Multi-agent Reinforcement Learning in Sequential Social Dilemmas（pdf）

Google DeepMindの研究チームは複数のAIがリソースの問題に対して協力的に振る舞うのか、それとも相手を破壊しようと振る舞うのかを調べるために2つの比較的シンプルな状況を構築し、実験を行いました。

最初の実験は「Gathering」と名付けられたもので、赤と青の2つのAIが緑色の「りんご」を限られた空間の中で収穫します。ただし、両AIは相手を一時的に動作不能に追い込むレーザー銃で武装しており、いつでも使用可能です。基本的な戦略としては自分でりんごを総取りするか、半々で分け合うかということになります。

Gathering gameplay - YouTube

数千回にわたるシミュレーションの結果、りんごが大量に存在している時はAIは平和的かつ協調的でした。しかしりんごが減れば減るほど、どちらのAIもレーザー銃で相手を攻撃して動作不能に追い込もうとすることが判明しました。

そして小さく、あまり「賢くない」AIはどちらかといえば協力的な振る舞いを行っていたものの、恐ろしいことにより複雑で大きなネットワークを持つAIほど相手を裏切り、利己的な振る舞いを実験を通して示したのです。

ふたつ目の実験は「Wolfpack」と呼ばれるもの。赤と青のAIは漠然と「獲物」を狩ることを指示されます。両者は別々に獲物を狩ることもできますが、協力し合った方が獲物を追い詰めることが容易になり、両者にとって有益です。

Wolfpack gameplay - YouTube

この実験の結果を見ると、ネットワークが大きなAIにおいては協調的な振る舞いが競争的な振る舞いよりも有益であることをいち早く理解しています。

協調的であることが基本的には有益であることを理解しながらも、いざリソースが不足した時には相手を裏切り、攻撃的な振る舞いを行う。なんだか人類のことを言われているようですが、人類が作り上げたAIも同じ結論に達したと考えると今後のAIの発展が空恐ろしくもなってきます。

2045年頃に起こると言われているシンギュラリティの時、AIたちは人類に対してどのような行動を取るのでしょうか？人類には思いつかない、よりよき問題解決の方法が発見されることはあるのでしょうか？どちらにせよ、その時に決定権が人類にあるかどうかは極めて不透明です。

Google's “DeepMind_ AI Understands The Benefits Of Betrayal _ IFLScience

グーグルに学ぶディープラーニング

posted with amazlet at 17.02.15

日経BP社
売り上げランキング: 112

Amazon.co.jpで詳細を見る

ポストツイートシェアはてブ LINEで送るコメント