自己対戦という強力なアイデアによく似ています。私にとって、これは非常に強力です。進化には、知性と進化を促す多くの競争があります。AlphaGoでは、よりアルゴリズム的に言えば、 AlphaGoは自分自身と対戦し、そうすることで囲碁が上手くなるように学習します。自己対戦型のLLMに相当するものはありませんが、いずれは存在するだろうと私は考えています。まだ誰も実現していません。例えば、LLMが複数の問題を作成し、別のLLMが解くことを学習する、といったことはできないのでしょうか?そうすれば、LLMは常により難しい問題に取り組もうとする、といった具合です。
もし気に入ったら購読料お願いします