引用ジャングル

「Gemma 4のコーディングベンチマークは、かろうじて機能するレベル（Codeforces ELO 110）から、競技プログラマーのエキスパートレベル（ELO 2150）へと飛躍的に向上しました。LiveCodeBenchのスコアはほぼ3倍に伸びました。コーディング能力の差は縮まっただけでなく、逆転したのです。31Bの高密度モデルは現在、Arena上の全オープンモデルの中で3位、米国オープンモデルの中では1位にランクインしています。しかし、落とし穴があります。MoEバリアント（26B-A4B）は、Qwenの同等モデルと比べて著しく動作が遅く、あるユーザーは、同じGPU上でGemma 4では1秒あたり11トークンだったのに対し、Qwen 3.5では1秒あたり60トークン以上だったと報告しています」

ローカルLLMがコーディングに適さなくなる閾値はどれくらいですか？ : r/LocalLLM

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル