Midjourneyは、他の多くのテキスト画像変換モデルと同様に、キートークンと重み付けされた概念の解析に依存しています。人間(あるいは言語モデル)のように言葉を理解するわけではありません。「エレガントな女性、ゴールデンアワー、映画のような照明」と読み上げ、それらを統計的な重みを持つ視覚的な手がかりとして解釈します。ChatGPTのようにニュアンス、意図、あるいは微妙なトーンの変化を解析することはできません。
物事を適切な言葉で表現するのに苦労しているとき、ChatGPT は翻訳者として機能し、あいまいなアイデアを Midjourney のようなモデルが実際に理解できるプロンプトに変換します。
もし気に入ったら購読料お願いします