DIA 1.6B は、 Nari Labsが開発した最先端の16 億パラメータのテキスト読み上げ (TTS) モデルであり、テキスト トランスクリプトから直接、非常にリアルで表現力豊かな対話を生成するように設計されています。

堅苦しい、または単調な音声を生成する従来の TTS システムとは異なり、DIA は、動的な感情、トーンの変化、さらには笑い、咳、咳払いなどの非言語的な発声を含む自然な会話のニュアンスを捉えることに優れています。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

You may also enjoy…