AlphaGoが超人的だったことです。どんな囲碁棋士にも勝っていました。AlphaZeroはAlphaGoに毎回勝っていました。つまり、超人よりもさらに超人的になる方法があるということです。また、AlphaZeroはアーキテクチャも異なっていました。つまり、あらゆる領域で汎用的に学習できるエージェントには、学習のためのより優れたアーキテクチャを与える方法があるように私には思えます。AlphaZeroがAlphaGoの改良版であり、MuZeroがAlphaZeroの改良版であったのと同じように。

AlphaZero が改良された点は、人間の知識を利用せず、経験だけに基づいた点です。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

You may also enjoy…