DeepSeek は現在、 OpenAI の同等の o1 モデルの3 ~ 5% の価格で動作します。そのため、開発者は以前よりもはるかに低いコストで AI アプリケーションを構築できるようになりました。
引用ジャングルは同名のTumblrページからインポートしています
最新の知見を知るサイト
-
-
2024 年 8 月、私は 20 歳の若者の投稿を偶然見つけました。その若者は、大量の郵送部品を使って自宅で核融合炉を組み立てました。さらに重要なのは、彼がこれを Anthropic の Claude AI サービスの指導を受けながら行ったということです。
核融合炉とは何でしょうか?クロードはこう言います。
フューザーは、核融合を実現できる最もシンプルな装置の一つとして注目されており、適切な安全プロトコルの下で上級アマチュア科学者によって構築されたバージョンもあります。
核融合装置は、静電場を利用してイオンを核融合条件まで加速する装置です。この装置は、接地電位の外側のグリッドと高い負電圧の内側のグリッドの 2 つの同心球状グリッドで構成されています。重水素ガスが導入されると、電界によって重水素イオンが中心に向かって加速され、衝突時に核融合が発生する可能性があります。
核融合炉は核融合を実現できますが、生産するエネルギーよりも消費するエネルギーの方が多いです。核融合炉は発電用ではなく、主に研究、教育、中性子源として使用されます。
-
シリコンバレーやワシントン DC の誰も、地政学的なプレートをさらに東にシフトさせる革新的な新製品によって自分たちの世界がひっくり返されようとしているとは、まったく想像していなかったことは今や明らかです。つまり、この議題は、10,000 マイル離れた場所に住む、異なる優先順位、価値観、信念を持つ人々によって設定されているのです。
-
先進的半導体に対する米国の輸出規制は中国のAIの進歩を遅らせることを意図したものだったが、意図せずしてイノベーションを促進してしまった可能性がある。
-
トランプ大統領がAI巨大契約を大々的に宣伝した後、中国のAI新興企業が1兆ドルの市場暴落を引き起こす
中国の人工知能スタートアップ企業の最新AIモデルが月曜日に市場を驚かせ、ドナルド・トランプ大統領がAIインフラへの民間部門5000億ドルの投資を後押しした1週間後に、米国と欧州のテクノロジー株は1兆ドルの下落に見舞われた。
-
「投資が増えても必ずしもイノベーションが増えるわけではない」
—DeepSeekを開発した会社の創設者、梁文峰氏
-
DeepSeek の API は、OpenAI の o1 モデルと同等のパフォーマンスを維持しながら、トークンあたりのコストが 95% 削減されています。DeepSeek モデルは、トレーニング側では他のモデルよりも 45 倍効率的であると考えられています。
-
32ビットの数値の代わりに8ビットの浮動小数点数を使用できる新しいトレーニング方法
おそらく、この論文の最も重要なブレークスルーの 1 つは、トレーニングに「業界標準」の 32 ビット数値ではなく 8 ビット浮動小数点数値を使用したことです。ここでのトレードオフは、8 ビットでは精度がいくらか犠牲になるものの、大量のメモリを節約できることです。しかし、DeepSeek は独自のシステムを開発し、数値を小さなタイルとブロックに分割し、重要なポイントでネットワークの高度な計算を使用しました。そうすることで、パフォーマンスをあまり犠牲にすることなく、大量のメモリを節約できたようです。メモリはトレーニング プロセスで非常に重要です。これは、Nvidia GPU が LLM のトレーニング プロセスを支配している主な理由の 1 つでもあります。LLM をトレーニングする場合、相互に通信する複数の GPU と、チップ外部の HBM メモリを使用する必要があります。Nvidia が強力な防御壁を持っている理由の 1 つは、AMD などの他の GPU プロバイダーと比較して、GPU とメモリ間の通信が最高であることです。
-
最高の AI モデルは、4 年前はネズミ、3 年前は犬、2 年前は高校生、1 年前は平均的な学部生、数か月前は博士号取得者と同程度の知能でしたが、現在ではそれぞれの分野では人間の博士号取得者よりも優れています。これを将来に当てはめてみてください。
-
AlphaGo は人間に勝つまでに何千万もの人間の手から学習する必要があり、そのプロセスには数か月かかりました。しかし、 AlphaGo Zero は人間の介入なしに自分自身と対戦することで、わずか3 日間で人間に勝つことを学習しました。
AlphaGo ZeroがAlphaGoを100対0で破った。