投稿者: | 2026年1月21日

大規模なモデルや長いコンテキストでの作業は、速度とコストがかかる可能性があります。実用的なヒントは、モデル選択とバッチ処理を賢く使用することです。初期のドラフトや繰り返しには安価で高速なモデルを使用し、最終的な出力や複雑な推論には最も有能な(そして高価な)モデルを予約しておくとよいでしょう。開発者の中には、計画や重要なステップに GPT-4 や Claude を使用する人もいますが、単純な拡張やリファクタリングはローカル モデルやより小さな API モデルにオフロードします。複数のエージェントを使用する場合、すべてを最上位層にする必要はありません。テスト実行エージェントやリンター エージェントは、より小さなモデルにすることができます。また、コンテキスト サイズの調整も検討してください。5,000 トークンで十分な場合は、20,000 トークンをフィードしないでください。前述したように、トークンを増やすと収益が減少する可能性があります。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です