Deep Blue は 1997 年 5 月に、当時の世界チェス チャンピオン、ガルリ カスパロフを 6 ゲームの試合で破り、歴史に名を残しました。Deep Blue は、1 秒あたり 2 億のチェス ポジションを評価できる特殊なハードウェアとアルゴリズムを採用しました。ブルート フォース検索手法とヒューリスティック評価関数を組み合わせることで、従来のどのシステムよりも深く潜在的な動きのシーケンスを検索できるようになりました。Deep Blue が特別なのは、膨大な数のポジションを迅速に処理し、チェスの組み合わせの複雑さを効果的に処理する能力であり、人工知能における重要なマイルストーンとなりました。
チェスのディープブルーの勝利から19年後、GoogleのDeepMindのチームは、AIの歴史に残る特別な瞬間に貢献する別のモデルを生み出しました。2016年、AlphaGoは囲碁の世界チャンピオン、イ・セドルを破った最初のAIモデルとなりました。
囲碁はアジア発祥の非常に古いボードゲームで、チェスをはるかに超えるほどの複雑さと膨大な数の局面が考えられます。AlphaGo はディープ ニューラル ネットワークとモンテ カルロ ツリー探索を組み合わせることで、局面を評価して効果的に動きを計画できるようになりました。
AlphaGo は盤面の状態を深く評価し、手を選択する並外れた能力を備えているため、Deep Blue よりも知能が高いと言えるかもしれません。
1 年後、Google DeepMind が再び注目を集めました。このとき、同社は AlphaGo から学んだことを多く取り入れ、チェス、囲碁、将棋をマスターする汎用 AI システムである AlphaZero を作成しました。研究者は、人間の事前知識やデータなしで、自己プレイと強化学習のみで AI を構築することができました。手作りの評価関数と広範なオープニング ライブラリに依存する従来のチェス エンジンとは異なり、AlphaZero はディープ ニューラル ネットワークと、モンテ カルロ ツリー探索と自己学習を組み合わせた新しいアルゴリズムを使用しました。
このシステムは、基本ルールのみからスタートし、何百万回ものゲームを自分自身と対戦することで最適な戦略を学習しました。AlphaZero が特別なのは、創造的で効率的な戦略を発見する能力であり、人間が設計した知識よりも自己学習を活用する AI の新しいパラダイムを示しています。
You may also enjoy…
コメントを残す