今月初め、カルパシー氏は、AIエージェントに機械学習のトレーニング環境を提供し、自律的に実験を行うための630行のPythonスクリプト「AutoResearch」をオープンソース化した。エージェントは自身のソースコードを読み込み、仮説を立て、コードを修正し、5分間トレーニングを行い、結果を評価し、変更内容を採用または破棄し、これを繰り返す。1時間に12回の実験が可能で、2日間で約700回の実験を行う。
その結果、人間の介入なしに20の改善点が発見され、11%の効率向上を実現し、より大規模なモデルにも適用可能となった。ShopifyのCEOは、同じ手法を一晩かけて実行し、37回の実験で19%のパフォーマンス向上を報告した。「すべてのLLM最先端研究所がこれを実施するだろう」とカルパシー氏は書いている。「これは最終決戦だ」