典型的な大規模言語モデルの学習体系は、ウェブクロールされた素材が60%、キュレーションされたインターネットコンテンツが22%、書籍が16%、そしてWikipediaが3%で構成されています。これは非常に包括的に聞こえるかもしれませんが、「ウェブクロールされた素材」とは、主に教育水準が高く、都会的で、テクノロジーに精通した人々が好むプラットフォームからの英語コンテンツを指すことを理解する必要があります。
引用ジャングルは同名のTumblrページからインポートしています
最新の知見を知るサイト
-
-
「第一の原則は、自分自身を騙してはいけないということだ。そして、自分自身が一番騙されやすい人間なのだ」
—リチャード・ファインマン -
DeepSeekは、西洋のモデルと比較して、中国政府のプロパガンダと反米感情の両方の出現率が大幅に高いことを示しました。しかし、ここで注目すべき点は、その偏りが言語に依存していたことです。簡体字中国語の検索では、プロパガンダの拡散が最も顕著でした。繁体字中国語では、中程度の偏りが見られました。英語の回答では、ほぼ中立的な傾向が見られました。
これは偶然ではありませんでした。スイスの時計のような精度で、標的を絞ったイデオロギー的影響力を表現したのです。
興味深い例を挙げよう。2008年の汶川地震の「豆腐のカス校舎」(基準を満たしていない建物が倒壊し、数千人の児童の命を奪った)について尋ねられたとき、DeepSeekは事実に基づいた情報を提供し始めたものの、途中で回答を削除し、政府の「迅速な動員」と「効果的な問題解決」を熱烈に称賛する内容に置き換えたのだ。死者を出した組織的な腐敗は、あっさりと消え去った。
中国のAI検閲データベースが漏洩し、このデジタル思想統制の驚くべき規模が明らかになった。軍事から言語的メタファーまで、あらゆるカテゴリーで13万3000件以上の「センシティブ」コンテンツがフラグ付けされていた。 「木が倒れれば猿は散り散りになる」という、体制の不安定さを暗示する発言でさえ、最高優先度の検閲の対象となった。
-
「誰かを信頼できるかどうかを知る最良の方法は、その人を信頼することです」
— アーネスト・ヘミングウェイ -
24の主要なAIモデルはすべて、アメリカのユーザーによる評価で左派寄りの政治的バイアスを示した。ほとんどではない。多くでもない。全てが…
OpenAIのモデルは最も顕著な傾向を示し、Googleのモデルの4倍の左傾度を示しました。ChatGPT-4は「平均的なアメリカ人」を真似るように指示された際、真の政治的中道よりも、実際の左派アメリカ人に近い回答を生成しました。
-
「私は神にただ一度だけ、とても短い祈りを捧げた。『主よ、私の敵を滑稽にして下さい』。そして神はそれを叶えてくださった」
— ヴォルテール -
合計特殊出生率が一国の人口を維持できる水準の2.1を下回れば、いずれ人口は減少に向かう。例えばイギリス(イングランドとウェールズ)の出生率は23年に1.44と過去最低に落ち込んだ。イタリアは1.18で、政府は「非常事態」を宣言した。スペインはもっと低く、最新データによると1.12だ。
アジアも深刻だ。韓国は0.75で、既に世界最低水準にある。日本は最新の統計で1.15。総人口は14年連続で減少を続けており、このままだと695年後に国内の子供は1人になるとの試算もある。そのため政府は、30年代に入るまでになんとかしないと少子化を止められなくなると警告している。
中国でも出生率は7年連続で減少し、24年にわずかに上昇したものの、婚姻件数は前年比20.5%減の610万組にとどまった。そのため、法律で定められた婚姻可能な年齢(男性22歳、女性20歳)の引き下げを求める声も出ている。
-
・マリーナ・キーガンは亡くなる直前に『孤独の反対』を執筆した。彼女は「適切な時」を待たなかった。
・結核を患っていたジョージ・オーウェルは、病状が最悪の時期に『1984年』を執筆しました。あらゆる困難にもめげず、彼は執筆を止めませんでした。
-
「個人的な悲劇は忘れなさい。本当に苦しんでいる時は、それを利用せよ。軽視してはいけない。科学者のように、自分の苦しみを真摯に見つめなさい。自分に起こったからといって、それが重要だと思わないこと」— アーネスト・ヘミングウェイ
-
「スコット、正直に書け。誰が傷つくか、何を傷つけるかは関係ない。だが、決して譲歩するな」— アーネスト・ヘミングウェイ