今、人々は強化学習をスケーリングしています。Twitterでの発言を見ると、強化学習は実際にはかなりの計算リソースを消費するため、現時点では事前学習よりも強化学習に多くの計算リソースを費やしているようです。非常に長いロー… 続きを読む »
「引用ジャングル」カテゴリーアーカイブ
2020年まで、つまり2012年から2020年までは研究の時代でした。そして今、2020年から2025年まではスケーリングの時代です。プラスマイナス、誤差の範囲で考えてみましょう。なぜなら、人々は「これは素晴らしい。もっ… 続きを読む »
実際、Twitterで何人かが言っていることを踏まえると、Geminiは事前学習からより多くの成果を得る方法を見つけたように見えるかもしれません。しかし、ある時点で事前学習のデータが枯渇します。データは明らかに有限です。… 続きを読む »
「スケーリング」はたった一つの単語ですが、人々に何をすべきかを伝える非常に強力な言葉です。人々は「スケールしてみましょう」と言います。では、何をスケーリングするのか? スケーリングに必要なのは事前トレーニングでした。それ… 続きを読む »
私たちが学習するものや、今話題にしているAIのようなものと比べると、感情は比較的単純であることには同意します。もしかしたら、人間が理解できる形でマッピングできるほど単純なものかもしれません。実現できたら素晴らしいと思いま… 続きを読む »
これはディープラーニングへの信頼の欠如と言えるでしょう。確かに難しいかもしれませんが、ディープラーニングでできないことはありません。価値関数は役に立つはずだと私は期待していますし、まだ使われていないとしても、将来的には使… 続きを読む »
価値関数とは、「常にではないにしても、時にはあなたがうまくやっているか、うまくいっていないかを教えられるかもしれない」といった類のことを言います。価値関数という概念は、ある分野ではより有用ですが、他の分野ではより有用です… 続きを読む »
強化学習を行う際、現在行われているような方法では、どのようにエージェントを訓練するのでしょうか?ニューラルネットワークに問題を与え、モデルに「解け」と指示します。モデルは数千、数十万の行動や思考などを経て、解を生成します… 続きを読む »
脳卒中か事故か、何らかの脳損傷によって感情処理能力が失われた人の話を読んだことがあります。そのため、彼は感情を一切感じることができなくなりました。それでも彼は非常に明瞭に話すことができ、ちょっとしたパズルを解くこともでき… 続きを読む »
どういうわけか、人間は15年も学習前のデータのほんの一部しか与えられていないにもかかわらず、知っていることははるかに少なくなっています。しかし、知っていることのすべてにおいて、どういうわけかはるかに深い知識を持っているの… 続きを読む »