「スケーリング」はたった一つの単語ですが、人々に何をすべきかを伝える非常に強力な言葉です。人々は「スケールしてみましょう」と言います。では、何をスケーリングするのか? スケーリングに必要なのは事前トレーニングでした。それ… 続きを読む »
私たちが学習するものや、今話題にしているAIのようなものと比べると、感情は比較的単純であることには同意します。もしかしたら、人間が理解できる形でマッピングできるほど単純なものかもしれません。実現できたら素晴らしいと思いま… 続きを読む »
これはディープラーニングへの信頼の欠如と言えるでしょう。確かに難しいかもしれませんが、ディープラーニングでできないことはありません。価値関数は役に立つはずだと私は期待していますし、まだ使われていないとしても、将来的には使… 続きを読む »
価値関数とは、「常にではないにしても、時にはあなたがうまくやっているか、うまくいっていないかを教えられるかもしれない」といった類のことを言います。価値関数という概念は、ある分野ではより有用ですが、他の分野ではより有用です… 続きを読む »
強化学習を行う際、現在行われているような方法では、どのようにエージェントを訓練するのでしょうか?ニューラルネットワークに問題を与え、モデルに「解け」と指示します。モデルは数千、数十万の行動や思考などを経て、解を生成します… 続きを読む »
脳卒中か事故か、何らかの脳損傷によって感情処理能力が失われた人の話を読んだことがあります。そのため、彼は感情を一切感じることができなくなりました。それでも彼は非常に明瞭に話すことができ、ちょっとしたパズルを解くこともでき… 続きを読む »
どういうわけか、人間は15年も学習前のデータのほんの一部しか与えられていないにもかかわらず、知っていることははるかに少なくなっています。しかし、知っていることのすべてにおいて、どういうわけかはるかに深い知識を持っているの… 続きを読む »
事前学習の最大の強みは、A. 膨大なデータ量があり、B. 事前学習にどのようなデータを入れるべきかを深く考える必要がないことです。事前学習は非常に自然なデータであり、人間の行動、つまり思考や特徴の多くを含んでいます。まる… 続きを読む »
競技プログラミングを例に考えてみましょう。二人の生徒がいるとします。一人は最高の競技プログラマーになりたいと思い、その分野で1万時間練習します。全ての問題を解き、全ての証明技法を暗記し、全てのアルゴリズムを迅速かつ正確に… 続きを読む »
例えば、バイブコーディングを使って何かをするとします。ある場所に行ってバグに遭遇します。モデルに「バグを直してもらえますか?」と尋ねると、モデルは「あらまあ、まさにその通り。バグがあります。直させてください」と返答します… 続きを読む »