マイクロソフトの AI 部門責任者であるムスタファ・スレイマン氏は、オープン Web 上に何かを公開した瞬間に、誰でも自由にコピーして使用できる「フリーウェア」になるという誤った考えを持っています。
「すでにオープン ウェブ上にあるコンテンツに関しては、90 年代以来、そのコンテンツの社会契約はフェアユースであるということだったと思います。誰でもそれをコピーし、それを使って再作成し、複製することができます。いわば「フリーウェア」であり、それが理解されてきました」
Microsoft は現在、同社と OpenAI が著作権で保護されたオンライン ストーリーを盗んで生成 AI モデルをトレーニングしているとして複数の 訴訟の標的となっているため、Microsoft の幹部がこれを完全に合法であると弁護しても驚かないかもしれません。
引用ジャングルは同名のTumblrページからインポートしています
最新の知見を知るサイト
-
-
「Googleは、Googleのサービスを向上させ、Googleのユーザーや一般ユーザーに有益な新しい製品、機能、技術を開発するために情報を使用します。たとえば、GoogleのAIモデルのトレーニングや、Google翻訳、Bard、クラウドAI機能などの製品や機能の構築に、一般に公開されている情報を使用します」
Googleは『公共のウェブのあらゆる場所』に投稿されたデータを収集して利用する権利を留保するかのように書いており、まるでインターネット全体がGoogleの遊び場であるかのようにも見て取れます。
-
それが短いツイートであれ、2009年のブログ記事、憎しみを込めたレビュー、Instagramの自撮り写真であれ、あなたがインターネット上に何かを投稿したことがあるなら、そのデータは現在の各種生成AIに取り込まれて学習に使われている可能性が高い。
テック企業は、生成AIの開発に必要だという名目で、コンテンツ制作者のことや著作権法、人々のプライバシーをほとんど考慮することなくウェブ上の膨大なデータをかき集めてきた。
その上、ユーザーの投稿データを大量に所有しているのをいいことに、その情報を販売したりライセンス供与したりしてAIのゴールドラッシュに乗っかろうとする企業も増えている。Redditよ、君のことだ。
さらに企業は、実際に何のデータを集めたのか、購入したのか、システムの学習に何を使用したのかについて明かさない。「あまり現状はわからない、というのが正直なところです」
Facebook、Google、XなどはAIの学習にユーザーのデータを使用する可能性がある旨をプライバシーポリシーに明記している。
データの抽出や共有のオプトアウトを許可しはじめている企業でも、ほとんどの場合はデフォルトでユーザーにオプトインさせている。「ユーザーがわざわざ探さないことをわかっているからこそ、ほとんどの企業は設定変更をやりづらくしています」
マイクロソフトのCopilotは、個人アカウントをもつユーザーに対し、プロンプトをソフトウェア改善のために使用させないという選択肢を提供していない。
アドビのAdobe Creative Cloudにファイルを保存している場合、ファイルはアドビの機械学習アルゴリズムの学習に使用される可能性がある。「製品の改善や開発を目的として利用者のコンテンツを分析する場合には、まずほかのユーザーのコンテンツと統合してから、統合済みのコンテンツを使ってアルゴリズムを学習させて製品およびサービスを改良します」と同社のFAQには記載されている。
Amazon Web Services(AWS)のAIサービスは、自社ツールの改善のために顧客データを保存することがある。
グーグルのチャットボットGeminiを使うと、AIモデル改善のために会話の内容が人間の開発者にレビューされる場合がある。
WordPressも所有するAutomattic社が提供するブログなどの投稿プラットフォームであるTumblrは、同社の他のプラットフォームも含めて、「非常に大規模かつユニークな公開コンテンツ群に興味のある」各AI企業と「協力している」という。
-
ヒカル未来へ-Let’s go to a bright future-Hikaru mirai e
CM
FULL Version
-
ChatGPTの開発元OpenAIのCEOサム・アルトマン氏やマイクロソフトの共同創業者ビル・ゲイツ氏など、大手テクノロジー企業の幹部は、データセンターの増大する電力需要に対する解決策として原子力エネルギーを推奨している。
アルトマン氏は、5月に白紙小切手合併により株式を公開した原子力発電の新興企業オクロ( OKLO.N )の出資者であり会長も務めている。一方、ゲイツ氏が共同設立した新興企業テラパワーは、6月に原子力施設の建設を開始した。
-
世界的な AI 需要により、2027 年までにデータ センターで1 兆ガロン以上の真水が消費される可能性があると推定しています。1 兆ガロンの水は、オリンピック サイズのプール約 150 万個分に相当します。
-
データセンターは現在、世界の電力使用量の1%以上を占めている。この数字は劇的に増加すると予想されており、2026年までにはデータセンターの消費エネルギーがスウェーデンやドイツなどの国全体と同量になる可能性があると予測されている。
-
ChatGPT は従来の Web 検索の15 倍のエネルギーを必要とすると Arm の幹部は述べています。
「10 年前は、30 メガワットのデータ センターは巨大だと考えられていました。今では、企業が 300 メガワットのデータ センターを建設する計画を発表しても、誰も驚きません。AI のおかげで、1 ギガワットのデータ センターが標準になっています」
-
-
BigTech の設備投資は 2024 年の 2,000 億ドルから 2025 年には 3,000 億ドルにまで増加する可能性が高いことが分かっています (モルガン スタンレーの予測)。必要なエネルギーと水はどこから来るのでしょうか?
Google と Meta はそれぞれ 626 億ドルと 523 億ドルを投資する予定である一方、Amazon と Microsoft はそれぞれ 964 億ドルと 899 億ドルを投資し、設備投資をリードすると予想されています。Microsoft、Amazon、Google、Oracle などのクラウド プロバイダーは、米国国内だけでなく、Microsoft のような東南アジアから Google のような南米まで、海外でも新しいデータセンターを構築するペースを拡大しています。
データセンターは今後数年間でかなりの量の電力を消費すると予想されています。ゴールドマン・サックスは、世界のデータセンターの電力需要が 2030 年までに 160% 増加し、総電力消費量の約 1 ~ 2% から約 3 ~ 4% に増加すると予測しています。