大規模言語モデルの人気学術テスト「人類の最後の試験」におけるGrok 4のパフォーマンスに言及した。このテストは、数学、科学、言語学など数十の科目で2,500問以上の問題で構成される。同社によると、Grok 4は追加ツールなしでテストを受けた場合、テキストベースの問題の約4分の1を解くことができたという。参考までに、OpenAIは2月に、同社のDeep Researchツールがテキストベースの問題の約26%を解くことができると述べている。
引用ジャングルは同名のTumblrページからインポートしています
最新の知見を知るサイト
-
-
OpenAIによるWindsurf買収契約は破談となり、Googleは代わりにWindsurfのCEOであるVarun Mohan氏、共同創業者のDouglas Chen氏、およびWindsurfのR&D従業員数名を雇用し、Google DeepMindチームに迎えると、GoogleとWindsurfは金曜日に発表した。
-
「達人は初心者が試みたよりも何度も失敗している」
-
グーグル(Google)のスンダー・ピチャイ(Sundar Pichai)CEOは、現在のAIの発展段階を「人工ギザギザ知能」を意味する「AJI(Artificial Jagged Intelligence)」と呼んだ。
「誰が最初にこの言葉を使い始めたのかは分からないが、おそらくカーパシー(Karpathy)ではないか」とピチャイは語った。ディープラーニング(深層学習)とコンピュータービジョンの専門家であり、OpenAIの共同創業者だったアンドレイ・カーパシー(Andrej Karpathy)のことだ。カーパシーは2024にOpenAIを離れている。
カーパシーは2024年に「ギザギザの知能(Jagged Intelligence)」というタイトルでXに投稿し、「最先端の大規模言語モデル(LLM)が、複雑な数学の問題を解くといった非常に高度な課題をこなせる一方で、信じられないような簡単な問題には苦戦するという(不自然で人間の感覚では理解しにくい)事実を表すため、私が考え出した言葉だ」と説明した。そして、9.9が9.11より大きいと理解できなかった例、三目並べのゲームで意味不明な判断を下した例、正しく数を数えられなかった例などを彼は紹介している。
ピチャイもその考えに同意しているようだ。
「AIにはできることがある一方、簡単な数の間違いや、例えば『strawberry』という綴りの中のRの数の単純なミスが簡単に見つかる。ほとんどのモデルがそこでつまずくようだ」とピチャイは語った。
-
AIは、実際に何かを作るためのツールではなく、人が自身のスキルを使って何かを作り上げるのを補助するツールだと考えているということです。それ以上のことをしようとすると、質が著しく低下し、個人的なタッチもまとまりも欠けてしまいます。
デザイナーとして、AIは漠然とした一般的なアイデアを吐き出すツールであり、具体的なアイデアはせいぜい中途半端なものに過ぎないと考えています。私がゲームデザインを始めたのは、コンピューターに生成させたものを世に出すのではなく、ゲームを作りたいからです。人々に感動を与える物語を書き、人々が楽しめるメカニクスを考え出し、そして自分が誇りに思える体験を作り上げたいのです。AIは、ブレインストーミングを活性化させるために時々使うツールであり、それ以上のものではありません。
プログラマーとして、私はそれを StackOverflow や Reddit で十分な速さで何も見つからない場合に関数を調べるツールと見ています。Vibe コーディング *震え* は、最適ではないスパゲッティのネズミの巣窟であり、実際に正しく機能するまでには何度も反復する必要があります (正常に機能するようになったとしても)。自分でコーディングするほど効果的ではなく (十分な経験がある場合)、売りになるスキルにはほとんどつながりません。また、必要な出力を得るために、それが何をしているかを具体的に制御することもほとんどできません。Google よりも具体的な情報を入手し、基本的な問題を解決することは、悪い結果が出た際にトラブルシューティングが得意である限り、AI プログラミングに適していると私は考えています。
アーティストとして…まあ、まさにそこから議論が白熱し始めるんですよね。スクレイピングや知的財産権の侵害の問題は、私から見れば全く擁護できません。でもそれ以外にも、クオリティの問題やまとまりのなさ(この問題は恐ろしいほど早く収束しつつあるようですが)が多すぎて、私の好みには合いません。個性が欠けているんです。これらの問題のために、別々に生成されたためにゲームに合わない大量のアセットを修正しなければなりません。たとえ時間、労力、費用がかかっても、自分のゲームに特化し、ゲームプレイとストーリーを喚起し、豊かにしてくれるアートを作りたいんです。ゲームのクオリティを向上させず、倫理的にもかけ離れた粗悪な作品のために、人々が職を失っているのは、本当に心が痛みます。AIアートは、せいぜい仮置きのアセットでしかなく、最悪の場合、ゲーム体験を台無しにしてしまうものだと思います。
-
ラテンアメリカでは英語がドイツほど流暢ではないという事実です。翻訳なしでは、ほとんどの人がゲームを理解できないでしょう。
-
私は半分ドイツ人で、特に若い世代は英語がとても流暢なので、ゲーム自体がドイツ語でなくても気にしません。
ほんの一握りの言語にしか翻訳できないのであれば、ドイツ向けにローカライズする価値はありません。ゲームにポルトガル語が含まれていなければ、ブラジル人はゲームを購入しません。ラテン世界でも同様です。
-
Steam 上で最も使用されている言語
36.31% 英語
26.73% 簡体字中国語
9.46% ロシア人
4.34% スペイン語
3.87% ポルトガル語
2.86% ドイツ語
2.59% 日本語
2.33% フランス語
1.68% ポーランド語
1.48% 韓国語例えばロシア人やドイツ人の多くは英語を話すので、ゲームが英語であってもそれほど問題にならないかもしれないが、スペイン語の国やブラジルでは英語力がそれほど高くない国がたくさんあるということも念頭に置いておく必要があります。
私のゲームでは、収益順に並べると、英語、ドイツ語、中国語(簡体字)、フランス語、日本語、韓国語の順でパフォーマンスが最も高い言語です。スペイン語は現実世界では非常に人気のある言語ですが、Steamでの収益は非常に小さいです。
-
フェイスレスなクリエイター、つまり中心的な人物がカメラに映ることなく、多くのフォロワーを獲得しているアカウントだ。そして、そのフェイスレスなクリエイターが現在、かなりの収益を上げている。
-
カメラが19世紀に登場した際も、手描きの肖像画と機械で撮った写真のどちらに価値があるのかという議論があった。のちにシャッターを切るだけで目の前の情景を写しとれるようになった道具によるものと、数十年の経験をもつ画家が描いたものを比較したとき、技術的な労力は後者が圧倒的に大きいが、現実の対象に近いのは写真のほうだった。
しかし、写真の登場が芸術を滅ぼしたわけではない。むしろ、芸術家たちはカメラという新しいツールに刺激され、印象派のような新しい表現を生み出した。同様に、AIの普及はわたしたちのクリエイティビティの定義を変えるかもしれないが、人間ならではの表現の価値を否定するものではない。