実際のモデルには数十億のパラメータがあり、それらすべてを一度にメモリに収める必要があります。優れたローカルコーディングモデルは、パラメータのサイズが約300億(略して30B)から始まります。デフォルトでは、これらのモデルはパラメータを表すために16ビットを使用します。16ビットで30Bのパラメータを持つモデルは、RAMで60GBのスペースを必要とします(16ビット = パラメータあたり2バイト、300億パラメータ = 600億バイト、つまり約60GB)。
実際のモデルには数十億のパラメータがあり、それらすべてを一度にメモリに収める必要があります。優れたローカルコーディングモデルは、パラメータのサイズが約300億(略して30B)から始まります。デフォルトでは、これらのモデルはパラメータを表すために16ビットを使用します。16ビットで30Bのパラメータを持つモデルは、RAMで60GBのスペースを必要とします(16ビット = パラメータあたり2バイト、300億パラメータ = 600億バイト、つまり約60GB)。