1,200ドルのGPU上で動作する40億のアクティブパラメータモデルが18か月前のクラウドモデルを上回り、その差が年に約2回縮まっているとすれば、現在のAI API収益のかなりの部分が、もはや時間の問題だと言えるでしょう。すべてがそうというわけではありません。最先端の推論、膨大なツールサーフェスを備えたエージェントシステム、そして絶対的な能力の限界は、しばらくの間クラウドに残るでしょう。しかし、「このドキュメントを要約する」「これらのフィールドを抽出する」「このメールを作成する」「このサポートの質問に答える」といったロングテールな作業はどうでしょうか?これらは今やコモディティワークロードであり、コモディティワークロードは時間の経過とともにローカルで実行されるようになります。