引用ジャングル

重要なのは、ポストトレーニングはまだ初期段階であり、事前トレーニングと比較して低コストで急速な改善を実現できることです。これが、OpenAIがわずか3か月でo1からo3に飛躍した方法です。DeepSeekが、より少なく劣ったGPUを所有していたにもかかわらず、 R1に追いついた方法です。これが、Grokがわずか2年でトップレベルに到達した方法です。

Grok 3: 苦い教訓からのもう一つの勝利

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル