この2年間、オープンソースAIをめぐる議論は、品質のギャップという観点から展開されてきた。クローズドモデルは最先端に位置し、オープンモデルは低価格版の代替品、つまりプロトタイプ開発には適しているものの、実用化には不向きなものと位置づけられてきた。
Gemma 4 はその議論に終止符を打ちます。AIME 2026 数学では 89.2% のスコアを獲得し、Llama 4 をわずかに上回ります。GPQA Diamond(大学院レベルの科学分野で、専門家が約 65% のスコアを獲得する)では 84.3% のスコアを獲得します。競技プログラミング (LiveCodeBench v6) では 80.0% のスコアを獲得します。