引用ジャングル」カテゴリーアーカイブ

人間のサンプル効率について考慮すべき説明の一つとして、進化が考えられるかもしれません。進化は、私たちに可能な限り有用な情報をほんの少しだけ与えてきました。視覚、聴覚、移動といった機能に関しては、進化が私たちに多くの情報を… 続きを読む »

最も根本的なことは、これらのモデルはどういうわけか人間よりも一般化が著しく劣っているということです。これは非常に明白なことです。非常に根本的なことのように思えます。 イリヤ・スツケヴェル – 私たちはスケーリングの時代か… 続きを読む »

今、人々は強化学習をスケーリングしています。Twitterでの発言を見ると、強化学習は実際にはかなりの計算リソースを消費するため、現時点では事前学習よりも強化学習に多くの計算リソースを費やしているようです。非常に長いロー… 続きを読む »

2020年まで、つまり2012年から2020年までは研究の時代でした。そして今、2020年から2025年まではスケーリングの時代です。プラスマイナス、誤差の範囲で考えてみましょう。なぜなら、人々は「これは素晴らしい。もっ… 続きを読む »

実際、Twitterで何人かが言っていることを踏まえると、Geminiは事前学習からより多くの成果を得る方法を見つけたように見えるかもしれません。しかし、ある時点で事前学習のデータが枯渇します。データは明らかに有限です。… 続きを読む »

「スケーリング」はたった一つの単語ですが、人々に何をすべきかを伝える非常に強力な言葉です。人々は「スケールしてみましょう」と言います。では、何をスケーリングするのか? スケーリングに必要なのは事前トレーニングでした。それ… 続きを読む »

私たちが学習するものや、今話題にしているAIのようなものと比べると、感情は比較的単純であることには同意します。もしかしたら、人間が理解できる形でマッピングできるほど単純なものかもしれません。実現できたら素晴らしいと思いま… 続きを読む »

これはディープラーニングへの信頼の欠如と言えるでしょう。確かに難しいかもしれませんが、ディープラーニングでできないことはありません。価値関数は役に立つはずだと私は期待していますし、まだ使われていないとしても、将来的には使… 続きを読む »

価値関数とは、「常にではないにしても、時にはあなたがうまくやっているか、うまくいっていないかを教えられるかもしれない」といった類のことを言います。価値関数という概念は、ある分野ではより有用ですが、他の分野ではより有用です… 続きを読む »

強化学習を行う際、現在行われているような方法では、どのようにエージェントを訓練するのでしょうか?ニューラルネットワークに問題を与え、モデルに「解け」と指示します。モデルは数千、数十万の行動や思考などを経て、解を生成します… 続きを読む »