AlphaGoが超人的だったことです。どんな囲碁棋士にも勝っていました。AlphaZeroはAlphaGoに毎回勝っていました。つまり、超人よりもさらに超人的になる方法があるということです。また、AlphaZeroはアーキテクチャも異なっていました。つまり、あらゆる領域で汎用的に学習できるエージェントには、学習のためのより優れたアーキテクチャを与える方法があるように私には思えます。AlphaZeroがAlphaGoの改良版であり、MuZeroがAlphaZeroの改良版であったのと同じように。
AlphaZero が改良された点は、人間の知識を利用せず、経験だけに基づいた点です。
You may also enjoy…
コメントを残す