自己学習で強くなる AI が創造性を生み出す（AlphaZero）

2018年12月7日、米学術誌 Scienceに発表された論文では、DeepMindが開発した AlphaZero（アルファゼロ）が、チェス・将棋・囲碁の3つの代表的なボードゲームにおいて、これまでに開発された最強のソフトウェアを数日で打ち負かす能力に成長できることが明らかにされました。AlphaZeroは囲碁で2017年に世界トップの実力を手にしてましたが、同じアルゴリズムを使って将棋、チェスでも世界最強のソフトウエアをつくりあげたことが専門家のレビューを通じて証明されました。

AlphaZero: Shedding new light on the grand games of chess, shogi and Go

AlphaZero（AIアルゴリズム）の特徴は、AlphaGo Zeroから進化させた「強化学習」の手法を駆使して、AIが自己学習で能力を高めていく点です。人間は将棋やチェス、囲碁のルールを教えるだけです。

チェス（9時間学習）では、世界最強ソフトとされるストックフィッシュ（StockFish）と1,000回対局して155勝6敗、残りは引き分けでした。将棋（12時間学習）は、エルモ（Elmo）と呼ばれる世界最強ソフトと競い、91.2%の勝率を得ています。囲碁（13日間学習）は、自社のアルファ碁（AlphaGo）と戦い勝率61%になりました。

AlphaZeroの顕著な成果は、過去のデータやシナリオに頼らない「新たなAIのあり方」が実証されたことです。AlphaZeroの100局分の棋譜を見た羽生善治氏は「王将を中段に動かすことをいとわないのは今までの将棋理論にはなく、新たな可能性を示している」とコメントしました。

AIから創造性が生じれば、その用途は絵画や音楽などの芸術の分野などに拡がります。これからは医薬、材料設計、バイオテクノロジーなどの科学技術や世界的な課題の解決を目指す研究と開発に応用される予定です。いま人類はエネルギーや気候変動、貧困、ウィルス感染などの地球規模の危機に直面、汎用人工知能（Artificial General Intelligence：AGI）への確実な進展を期待したいと思います。