OpenAIのPersonQAベンチマークによる内部テストによると、o3の幻覚率は33%であるのに対し、o1は16%でした。さらに懸念されるのは、o4-miniの幻覚率は48%に達したことです。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

You may also enjoy…