OpenAIのPersonQAベンチマークによる内部テストによると、o3の幻覚率は33%であるのに対し、o1は16%でした。さらに懸念されるのは、o4-miniの幻覚率は48%に達したことです。
メールアドレスが公開されることはありません。 ※ が付いている欄は必須項目です
コメント ※
名前 ※
メール ※
サイト
次回のコメントで使用するためブラウザーに自分の名前、メールアドレス、サイトを保存する。
Δ
You may also enjoy…
コメントを残す