大規模推論モデル(LRM)は8枚のディスクを使ったハノイの塔では失敗しました。最適解は255手で、いわゆるトークン制限の範囲内です。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

You may also enjoy…