引用ジャングルは同名のTumblrページからインポートしています

最新の知見を知るサイト

  • MidjourneyとPhotoshopを使ってアート作品を作ることについて、私の考えはもうご存知でしょう。要約すると、レゴの写真の背景を作るのにMidjourneyは大好きですが、思い描いた通りの結果を得るには、かなりの編集作業や調整、時には大声で叫ぶことさえあります。Photoshopのジェネレーティブフィルは90%の確率で失敗しますが、残りの10%では画像を拡大するのに驚くほど便利です。

  • 20世紀初頭、農業研究者たちはメンデルが1866年に初めて発表した遺伝学の画期的な新知見(注:すでに40年も前の話です)を応用し始めました。

    基本的な考え方は、4系統の植物を数世代にわたって近親交配し、次に交配種同士を交配し、さらにその交配種同士を交配するというものです。するとなんと、収穫量が15%も向上するのです。

  • 「バイブコーディング」、つまり会話型のプロンプトを通じて機能的なソフトウェアを開発することは、開発者の効率性を向上させるだけではありません。アイデアを持つ誰もがソフトウェア開発を行えるようにするのです。

    StackBlitz( Bolt.newの開発元)に投資した際、私たちの注目を集めたのは、その製品の爆発的な成長だけではありませんでした。それを使って開発を行っている人たちの存在も大きな魅力でした。多くのユーザーはコーディング経験がほとんど、あるいは全くありません。彼らはドメインエキスパート、ナレッジワーカー、そしてクリエイティブな思考を持つ人々で、これまで技術的な支援なしにはソフトウェアのアイデアを実現できなかった人たちです。

    これを示す傾向の 1 つは、「使い捨てアプリ」の出現です。使い捨てアプリとは、長期的な使用をほとんど期待せずに、当面のニーズに合わせて作成された専用ソフトウェアです。

    これらは、特定の分析のために作成し、数回使用して一度も保存したことのないスプレッドシートに相当するGenAIのツールです。従来のソフトウェア開発に伴うオーバーヘッドを伴わずに、差し迫った問題を解決します。

    ここで注目すべきは、ソリューションだけでなく、それを作成する際の経済性です。使い捨てのアプリケーションに時間をかけるのはおそらく割に合わないでしょう。目的に特化したソフトウェアの作成は、スプレッドシートの作成と同じくらいスムーズになりつつあります。

  • 従来のAPIでは、正確なパラメータフォーマット、エラー処理、レスポンス解析が求められます。AIモデルは確率的な出力を行うため、パラメータの誤認、レスポンスフォーマットの誤認識、エラー処理の失敗といった問題が頻繁に発生します。そのため、大規模なAIエージェントによる信頼性の高いツールの利用はほぼ不可能でした。

    MCPは、AIモデルが利用可能なツールを検知し、それらの正しい使用方法を理解し、異なるツールを切り替えながら会話のコンテキストを維持するための標準化された方法を提供することで、この問題を解決します。エージェントとツールのインタラクションに決定論と構造をもたらし、新しいツールごとにカスタムコードを作成することなく、信頼性の高い統合を実現します。

    これが実際にどのような違いを生むかを理解するには、ユーザーが AI アシスタントに「Figma デザインに赤いボタンを追加してください」と依頼したときに何が起こるかを考えてみましょう。

    MCPがない場合:AIはFigmaのAPIを呼び出すコードを生成しようとしますが、パラメータを誤って認識したり(「setColor(‘crimson’)」と誤認識するなど)、認証手順を省略したり、レスポンスを正しく処理できなかったりする可能性があります。その結果、ユーザーの不満が募り、ワークフローが機能不全に陥ることになります。

    MCPの場合:CursorがFigmaのMCPサーバーに接続すると、AIは利用可能なメソッド、必要なパラメータ、そしてリクエストの適切なフォーマット方法を正確に把握します。Figma MCPサーバーはCursorに「赤いボタンを追加する方法はこれです」と指示し、そのアクションは確実に成功します。ユーザーは、基盤となる技術的な詳細を理解することなく、要求したものを入手できます。この決定論的なインタラクションこそが、MCPがこれほど大きな注目を集めている理由です。MCPは、予測不可能なAI実験を信頼性の高い本番環境ツールへと変換します。

  • Anthropicが2024年11月にMCPを初めてリリースして以来、その勢いは紛れもないものとなっています。OpenAIもMCPをサポートしています。AmazonとMicrosoftも同様です。GoogleはAgent2Agent(A2A)プロトコルを発表し、CiscoはAgent Connect Protocol(ACP)を発表しました。どちらも少なくとも現時点ではMCPの「補完的」な位置付けです。MCP ServerリポジトリのGitHubスターは25,000を超え、目覚ましい勢いで増加しています。

  • クラウドコンピューティングについて言えば、GoogleはAI企業でありソフトウェア企業でもあるだけでなく、ハイパースケーラーでもある。Google CloudはAnthropicのような企業にチップを貸し出し、Nvidiaのような企業と提携している。一方、OpenAIはMicrosoftのAzureに依存しており、AnthropicはさらにAmazonのAWSに依存している。両社ともAI関連のリリースでGoogleを翻弄しているが、Googleはクラウド分野において真の巨人であるMicrosoftとAmazonに右腕で挑んでいるのだ。

  • 検索は、月間アクティブユーザー数が20億人を超える7つのGoogle製品(検索、YouTube、Android、マップ、Chrome、Gmail、Playストア)のうちの1つに過ぎません。OpenAIがChatGPTの週アクティブユーザー数を5億人にまで押し上げたことは称賛に値しますが(これもまた称賛に値します)、両者の実力は桁違いです。GoogleがGeminiを自社製品群全体に追加したらどうなるでしょうか? 突如、数十億人の人々が世界最高のAIに無料でデフォルトでアクセスできるようになるのです。言うまでもなく、同じく非常に人気の高いWorkspaceクラウドサービス(ドライブ、Gmail、ドキュメント、スプレッドシートなど)も例外ではありません。

  • OpenAIは、Googleが既に王者となっている分野に参入しようとしている。検索(最も重要なソフトウェア分野の一つ)を例に挙げてみよう。GoogleとYouTube(検索トラフィック総量で1位と2位、どちらもAlphabet傘下)は、世界の総トラフィックシェア(デスクトップ)の50%を占めている。ChatGPTは(称賛に値するが)2.33%で6位だ。2年前に「ChatGPTはGoogleを倒した」のではないだろうか?サム・アルトマンは、究極のボスに挑もうとしていることを理解している。(それに、もし誰かがデータの堀を持っているとすれば、それはGoogleだ。YouTube、検索、書籍、写真など)。

  • Googleは、自社が保有する他のAIツール、Lyria (音楽)、Imagen 3 (画像)、Veo 2 (動画)、Chirp 3 (音声認識)をVertex AIに統合すると発表しました。

  • 平均的なクリエイターの場合、100 万回再生されたバイラル動画で得られる収益は通常、次のとおりです。

    YouTube動画で 1,000 ~ 8,000 ドル(高視聴回数を獲得するのは非常に困難)、
    TikTok で 300 ~ 1,000 ドル(以前は簡単でしたが、現在はかなり困難)、
    YouTube Shorts で 200 ~ 300 ドル(中程度の困難)、
    Instagram で 0 ドル(簡単だが、虚栄心の表れ)、
    Facebook で 0 ドル(誰が気にするか)、
    Threads で 0 ドル(ほとんど私のレーダーには映らない)、
    Bluesky/Skylight で 0 ドル(素晴らしいプラットフォームだが、大幅に減速しており、収益化されていない)

    多額に見えるかもしれませんが、税金のために25%を差し引いてください。そして、100万回再生される動画を作るのは、才能、タイミング、リーチ、そして運に左右される、非常に難しい仕事であることを理解してください。そして、それで本当に生計を立てるには、毎月3~5本のバイラル動画に加え、毎日、バイラルではない動画を継続的に制作する必要があります。

    これが、トップクラスのコンテンツ クリエイターでさえ、数年後には活動を停止したり方向転換したりする理由です。