AIの空間認識能力は人間のレベルには程遠いということです。そして、その限界はすぐに明らかになります。最先端のMLLMモデルでさえ、距離、方向、大きさの推定、あるいは物体を新しい角度から再生することで「精神的に」回転させるといった点において、偶然以上のパフォーマンスを発揮することは稀です。迷路を進んだり、近道を認識したり、基本的な物理法則を予測したりすることもできません。AIが生成した動画(まだ初期段階で、確かに非常に優れたものですが)は、数秒後には一貫性を失ってしまうことがよくあります。
AIの空間認識能力は人間のレベルには程遠いということです。そして、その限界はすぐに明らかになります。最先端のMLLMモデルでさえ、距離、方向、大きさの推定、あるいは物体を新しい角度から再生することで「精神的に」回転させるといった点において、偶然以上のパフォーマンスを発揮することは稀です。迷路を進んだり、近道を認識したり、基本的な物理法則を予測したりすることもできません。AIが生成した動画(まだ初期段階で、確かに非常に優れたものですが)は、数秒後には一貫性を失ってしまうことがよくあります。