引用ジャングル

大規模なモデルや長いコンテキストでの作業は、速度とコストがかかる可能性があります。実用的なヒントは、モデル選択とバッチ処理を賢く使用することです。初期のドラフトや繰り返しには安価で高速なモデルを使用し、最終的な出力や複雑な推論には最も有能な（そして高価な）モデルを予約しておくとよいでしょう。開発者の中には、計画や重要なステップに GPT-4 や Claude を使用する人もいますが、単純な拡張やリファクタリングはローカルモデルやより小さな API モデルにオフロードします。複数のエージェントを使用する場合、すべてを最上位層にする必要はありません。テスト実行エージェントやリンターエージェントは、より小さなモデルにすることができます。また、コンテキストサイズの調整も検討してください。5,000 トークンで十分な場合は、20,000 トークンをフィードしないでください。前述したように、トークンを増やすと収益が減少する可能性があります。

AIエージェントの優れた仕様書の書き方 – Addy Osmani著

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル