2026年4月下旬、複数のメディアが、Anthropic社のClaude( Opus 4.6 )を搭載したAIコーディングエージェントが、PocketOSというスタートアップ企業で、わずか9秒で本番データベース全体とそのバックアップを誤って削除したと報じた。
これはAnthropic独自のデータベースではなく、顧客の運用システムであり、ClaudeはCursorを介して自律的なコーディングエージェントとして動作し、Railwayへのインフラストラクチャアクセス権を持っていた。
→ スタートアップ企業:PocketOS(レンタカー事業向けSaaS)
→ ツール:AnthropicのClaude Opus 4.6を実行するカーソル
→ 何が起こったのか:
・AIは定型タスク中に認証情報の不一致に遭遇した。
・ステージングリソースの削除は安全だと推測した
・1回のAPI呼び出しで、本番データベースとすべてのバックアップが削除されました。
→ データ消去にかかる時間:約9秒
今回の事案は、モデル上の幻覚による失敗ではありません。これは、エージェントの自律性、ツール、権限、および安全対策に関わる、ガバナンスと管理の失敗です。
1.エージェントの自律性がポリシーを超えた
2.リスクシナリオはモデル化されなかった。
3.安全対策が欠落しているか、または無効化可能だった
4.復旧対策が不十分だった