GoogleはTPUを保有しています。AmazonはTrainiumとInferentiaを推進しています。すべてのクラウドプロバイダーはNVIDIAから離れることを望んでいます。これらのチップはLLMワークロードに最適化されており、価格性能比でGPUを下回ります。
例: AWS Inferentia2 はすでに、A100 よりもトークンあたりのコストが低い LLaMA モデルを実行しています。GPU は長期的なデフォルトではありません。
もし気に入ったら購読料お願いします
引用ジャングル
もし気に入ったら購読料お願いします
GoogleはTPUを保有しています。AmazonはTrainiumとInferentiaを推進しています。すべてのクラウドプロバイダーはNVIDIAから離れることを望んでいます。これらのチップはLLMワークロードに最適化されており、価格性能比でGPUを下回ります。
例: AWS Inferentia2 はすでに、A100 よりもトークンあたりのコストが低い LLaMA モデルを実行しています。GPU は長期的なデフォルトではありません。
もし気に入ったら購読料お願いします