引用ジャングル

投稿者: qqjjmas01 | 2025年10月11日

懸念すべきことに、Sonnet 4.5は「言語化された評価認識」がはるかに高いことを発見しました（Anthropicのこれまでの最高AIであるOpus 4.1の22%に対して58%）。これは、AIがテストを受けている間、ほとんどの場合、AIは自分の行動を確認するためのテストを受けていることを認識していることを研究者は明確に認識していることを意味します。

崖っぷちに立たされて：AIの規制

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル