重要なのは、ポストトレーニングはまだ初期段階であり、事前トレーニングと比較して低コストで急速な改善を実現できることです。これが、OpenAIがわずか3か月でo1からo3に飛躍した方法です。DeepSeekが、より少なく劣ったGPUを所有していたにもかかわらず、 R1に追いついた方法です。これが、Grokがわずか2年でトップレベルに到達した方法です。
You may also enjoy…
重要なのは、ポストトレーニングはまだ初期段階であり、事前トレーニングと比較して低コストで急速な改善を実現できることです。これが、OpenAIがわずか3か月でo1からo3に飛躍した方法です。DeepSeekが、より少なく劣ったGPUを所有していたにもかかわらず、 R1に追いついた方法です。これが、Grokがわずか2年でトップレベルに到達した方法です。
You may also enjoy…
コメントを残す