上の赤い四角の数字 2 のような手書きの 10 進数を識別できるネットワークを作成するとします。このようなネットワークは、画像内の各ピクセルの強度値を受け取り、0、1、2 などの 10 個の可能な数字の確率分布を出力します。
このようなネットワークをトレーニングするには、まずランダムな重みで初期化します。次に、一連のサンプル画像で実行します。画像ごとに、ネットワークを正しい答え (この場合は、「2」出力の高確率値) に導く接続を強化し、間違った答え (「2」の低確率と他の数字の高確率) に導く接続を弱めて、ネットワークをトレーニングします。十分なサンプル画像でトレーニングすると、モデルは 2 が表示されたときに「2」の高い確率を予測し始め、それ以外の場合は予測しなくなります。