重要なのは、ポストトレーニングはまだ初期段階であり、事前トレーニングと比較して低コストで急速な改善を実現できることです。これが、OpenAIがわずか3か月でo1からo3に飛躍した方法です。DeepSeekが、より少なく劣ったGPUを所有していたにもかかわらず、 R1に追いついた方法です。これが、Grokがわずか2年でトップレベルに到達した方法です。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

You may also enjoy…