2025年9月29日:AnthropicはClaude Sonnet 4.5をリリースし、コーディング能力とエージェントのパフォーマンスが劇的に向上しました。このモデルはテスト中に30時間連続で自律的にコーディングを実行しました。これは前モデルの4倍以上の時間です。
2025年11月12日:OpenAIはGPT-5.1をリリースし、タスクの複雑さに応じて計算量を自動的にスケーリングする「適応型推論」を導入しました。このアップデートは、GPT-5のトーンに関するユーザーからの不満に直接対処するとともに、より高速で会話的なインタラクションを実現しました。
2025年11月17日:GoogleはGemini 3 Proを発表し、LMArenaで画期的なEloスコア1501を記録して1位を獲得しました。CEOのサンダー・ピチャイは、このモデルを同社史上「最もインテリジェントなモデル」と評し、主要ベンチマーク全てにおいて最先端のパフォーマンスを発揮しました。
2025年11月24日:AnthropicはClaude Opus 4.5をリリースし、SWE-bench Verifiedで前例のない80.9%のスコアを達成しました。これは、実世界のソフトウェアエンジニアリングタスクで80%を突破した初のモデルです。同時に、同社は価格を67%引き下げました。