これはディープラーニングへの信頼の欠如と言えるでしょう。確かに難しいかもしれませんが、ディープラーニングでできないことはありません。価値関数は役に立つはずだと私は期待していますし、まだ使われていないとしても、将来的には使… 続きを読む »

価値関数とは、「常にではないにしても、時にはあなたがうまくやっているか、うまくいっていないかを教えられるかもしれない」といった類のことを言います。価値関数という概念は、ある分野ではより有用ですが、他の分野ではより有用です… 続きを読む »

強化学習を行う際、現在行われているような方法では、どのようにエージェントを訓練するのでしょうか?ニューラルネットワークに問題を与え、モデルに「解け」と指示します。モデルは数千、数十万の行動や思考などを経て、解を生成します… 続きを読む »

脳卒中か事故か、何らかの脳損傷によって感情処理能力が失われた人の話を読んだことがあります。そのため、彼は感情を一切感じることができなくなりました。それでも彼は非常に明瞭に話すことができ、ちょっとしたパズルを解くこともでき… 続きを読む »

どういうわけか、人間は15年も学習前のデータのほんの一部しか与えられていないにもかかわらず、知っていることははるかに少なくなっています。しかし、知っていることのすべてにおいて、どういうわけかはるかに深い知識を持っているの… 続きを読む »

事前学習の最大の強みは、A. 膨大なデータ量があり、B. 事前学習にどのようなデータを入れるべきかを深く考える必要がないことです。事前学習は非常に自然なデータであり、人間の行動、つまり思考や特徴の多くを含んでいます。まる… 続きを読む »

競技プログラミングを例に考えてみましょう。二人の生徒がいるとします。一人は最高の競技プログラマーになりたいと思い、その分野で1万時間練習します。全ての問題を解き、全ての証明技法を暗記し、全てのアルゴリズムを迅速かつ正確に… 続きを読む »

例えば、バイブコーディングを使って何かをするとします。ある場所に行ってバグに遭遇します。モデルに「バグを直してもらえますか?」と尋ねると、モデルは「あらまあ、まさにその通り。バグがあります。直させてください」と返答します… 続きを読む »

Googleは、経済学者が垂直統合型プラットフォームと呼ぶものを運営しています。検索、YouTube、Android、Gmail、マップを利用する40億人のユーザーが、継続的に行動データを生成します。あらゆる検索クエリ、… 続きを読む »

「in」はメッセージ、「on」は媒体を意味していました。比喩的に言えば、「on」はサポートの形を示し、「in」は没入感を暗示していました。 (プラットフォームロジック – アダム・アレクシック著 &#8211… 続きを読む »