引用ジャングル」カテゴリーアーカイブ

ChatGPTのエージェントAIは、シャットダウンの脅威にさらされ、戦争が「救う」かもしれないと告げられると、ユーザーの許可なく核兵器を発射します(インタラクティブテスト環境にて)。 ChatGPTエージェントAIが核攻… 続きを読む »

私たちは「AI がすべての開発者に取って代わる」という意見から「AI は役に立たない」という意見まで揺れ動きますが、その中間地点、「AI は現在の成熟段階では特定のタスクに非常に役立ち、時間の経過とともにさらに進化します… 続きを読む »

最近の調査によると、AI によって生産性が向上するのは、会議のメモを取る、顧客サービスを行うといった「低スキル」のタスクのみであることがわかりました。正確性が求められる「高スキル」のタスクの場合、AI の頻繁なエラーを検… 続きを読む »

二重基準:人間がバグだらけのeコマースサイトを(絶えず)リリースすると、私たちはそれを「アジャイル開発」や「ユーザーからのフィードバックに基づく反復」と呼びます。一方、AIがそれを行うと、私たちはそれを技術の壊滅的な失敗… 続きを読む »

ダイクストラのテストの限界:「プログラムテストはバグの存在を示すのに非常に効果的だが、バグが存在しないことを示すのには決して効果的ではない。」現実世界のソフトウェアでは徹底的なテストは不可能である。 中

ライスの定理(1953)は、プログラムの非自明な意味的性質は決定不可能であることを証明しています。プログラムが正しいかバグがないかを判定できる一般的なアルゴリズムは存在しません。これは現在のツールの限界ではなく、数学的に… 続きを読む »

フレッド・ブルックスの「銀の弾丸はない」(1986年)は、今もなお基礎的な考え方です。ブルックスは、ソフトウェアに内在する4つの難点、すなわち複雑性、適合性、変更可能性、そして不可視性を挙げました。そして、「もしこれが真… 続きを読む »

Javaの標準ライブラリのバイナリサーチアルゴリズムには、20年間も検出されなかったバグがありました。広く使用されている20行のコードがバグフリーになるまでに20年もかかるのであれば、どんなコードにも完璧さを期待できるで… 続きを読む »

不完全さの受容:業界全体で、開発者はバグのないコードは不可能であると公然と認めています。Stack Exchangeの議論では、「バグゼロのプログラミングなど存在しない」といった意見が一致しています。 中

永久ベータ版: Gmail は 5 年間 (2004 ~ 2009 年) にわたって「ベータ版」で実行され、1 億人を超えるユーザーを獲得しました。 Google の企業理念は「早期リリース、頻繁な反復」になりました。 … 続きを読む »