2年前、GPT-4はクレート名を誤認識せずにRust関数を書くことができませんでした。2026年4月までに、Claude Opus 4.7、GPT-5.5、Gemini 3.1、およびDeepSeek V4は、数週間以内にSWE-bench Verifiedで80%をクリアしました。ラボは、計画段階で特定された並行処理のバグ、競合状態、およびアーキテクチャ上の欠陥など、システム作業の最適化を公然と行っています。
2年前、GPT-4はクレート名を誤認識せずにRust関数を書くことができませんでした。2026年4月までに、Claude Opus 4.7、GPT-5.5、Gemini 3.1、およびDeepSeek V4は、数週間以内にSWE-bench Verifiedで80%をクリアしました。ラボは、計画段階で特定された並行処理のバグ、競合状態、およびアーキテクチャ上の欠陥など、システム作業の最適化を公然と行っています。