投稿者: | 2026年4月4日

「Gemma 4のコーディングベンチマークは、かろうじて機能するレベル(Codeforces ELO 110)から、競技プログラマーのエキスパートレベル(ELO 2150)へと飛躍的に向上しました。LiveCodeBenchのスコアはほぼ3倍に伸びました。コーディング能力の差は縮まっただけでなく、逆転したのです。31Bの高密度モデルは現在、Arena上の全オープンモデルの中で3位、米国オープンモデルの中では1位にランクインしています。しかし、落とし穴があります。MoEバリアント(26B-A4B)は、Qwenの同等モデルと比べて著しく動作が遅く、あるユーザーは、同じGPU上でGemma 4では1秒あたり11トークンだったのに対し、Qwen 3.5では1秒あたり60トークン以上だったと報告しています」

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です