2025年3月、カリフォルニア州サンフランシスコのOpenAIが開発した大規模言語モデル(LLM)GPT-4.5は、人間によるチューリングテストで73%の確率で人間であると判定されました。これは実際の人間よりも高い割合です。さらに、読者はLLMによって生成された文学作品の方が、人間の専門家が書いた作品よりも好むことさえありました。
これはほんの一部に過ぎません。法学修士(LLM)は、国際数学オリンピックで金メダルを獲得し、一流の数学者と共同で定理を証明し、実験で検証された科学的仮説を立て、博士課程の試験問題を解き、プロのプログラマーのコード作成を支援し、詩を創作し、そして世界中の何億人もの人々と24時間365日チャットするなど、実に様々な活動を行ってきました。言い換えれば、法学修士(LLM)は、チューリングが重視したような幅広く柔軟な認知能力、つまり現在では「汎用知能」と呼ばれるものの、チューリング自身はこの用語を使っていませんでしたが、その兆候を数多く示してきました。