DeepSeek V4は、春節(2026年2月中旬)頃にリリースされると噂されています。リーク情報によると、革新的なEngramアーキテクチャを搭載した「コーディングファースト」モデルになるとのことです。静的メモリ(知識の保存)と動的推論(GPU計算)を分離することで、検索速度の向上と推論コストの大幅な削減を実現しています。社内テストでは、長文コード生成と複数ファイル推論においてGPTやClaudeを上回る性能を発揮する可能性があることが示されており、AIモデルの動作に根本的な変化をもたらす可能性があります。
V4を理解するには、DeepSeekの戦略を理解する必要があります。彼らはモデルをランダムにリリースするのではなく、すべての動きは計画的です。
・DeepSeek V2: 「効率」に重点を置きました。MLA (Multi-Head Latent Attention) を導入し、強力な推論を実現するためにブルート フォース スケールは必要ないことを証明しました。
・DeepSeek V3:実用性を重視し、MoE(Mixture of Experts)を採用しました。最高レベルのコーディングと推論処理をわずかなコストで実現し、開発者にとって「静かなるパワーハウス」となりました。
・DeepSeek R1:「推論ファースト」の実験。一般的なタスクではなく、長い思考の連鎖と深い論理に焦点を当てており、本質的には「スケールする前に、思考方法を理解しよう」と主張しています。