引用ジャングル

2025年9月29日：AnthropicはClaude Sonnet 4.5をリリースし、コーディング能力とエージェントのパフォーマンスが劇的に向上しました。このモデルはテスト中に30時間連続で自律的にコーディングを実行しました。これは前モデルの4倍以上の時間です。

2025年11月12日：OpenAIはGPT-5.1をリリースし、タスクの複雑さに応じて計算量を自動的にスケーリングする「適応型推論」を導入しました。このアップデートは、GPT-5のトーンに関するユーザーからの不満に直接対処するとともに、より高速で会話的なインタラクションを実現しました。

2025年11月17日：GoogleはGemini 3 Proを発表し、LMArenaで画期的なEloスコア1501を記録して1位を獲得しました。CEOのサンダー・ピチャイは、このモデルを同社史上「最もインテリジェントなモデル」と評し、主要ベンチマーク全てにおいて最先端のパフォーマンスを発揮しました。

2025年11月24日：AnthropicはClaude Opus 4.5をリリースし、SWE-bench Verifiedで前例のない80.9%のスコアを達成しました。これは、実世界のソフトウェアエンジニアリングタスクで80%を突破した初のモデルです。同時に、同社は価格を67%引き下げました。

320億ドルの幽霊：イリヤ・スツケヴァー氏が「スケーリングは死んだ」と宣言した理由 | Medium

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル