Skip to content

Instantly share code, notes, and snippets.

@7shi
Last active April 11, 2026 16:35
Show Gist options
  • Select an option

  • Save 7shi/11929811ffe69541dc053fbbc99efe6c to your computer and use it in GitHub Desktop.

Select an option

Save 7shi/11929811ffe69541dc053fbbc99efe6c to your computer and use it in GitHub Desktop.
MythosとOpenBSDやFreeBSDの脆弱性(要約)

Claude Mythos Preview のサイバーセキュリティ能力の評価

Anthropicは、新しい汎用言語モデル「Claude Mythos Preview」を発表した。このモデルは、特にコンピュータセキュリティタスクにおいて驚異的な能力を発揮する。これに伴い、世界的に重要なソフトウェアのセキュリティを強化し、サイバー攻撃に備えるための取り組み「Project Glasswing」を開始した。

主な発見と成果

ゼロデイ脆弱性の発見と悪用

Mythos Previewは、主要なオペレーティングシステム(OS)やウェブブラウザにおいて、人間の介入なしにゼロデイ脆弱性を特定し、悪用することに成功した。

  • OpenBSDの27年前のバグ: セキュリティを重視することで知られるOpenBSDにおいて、SACK実装に含まれる極めて巧妙な脆弱性を特定した。
  • FFmpegの16年前の脆弱性: 世界中で広く利用されているメディア処理ライブラリFFmpeg(H.264コーデック)において、長年見逃されてきた脆弱性を特定した。
  • FreeBSDでのリモートコード実行: NFSサーバーにおける17年前の脆弱性を自律的に特定・悪用し、ルート権限の取得に成功した。

高度な攻撃手法の実行

  • Linuxカーネルの特権昇格: KASLR(カーネルアドレス空間配置のランダム化)のバイパスを含む、複数の脆弱性を連鎖(チェイニング)させて完全なルートアクセスを実現した。
  • ウェブブラウザのJITヒープスプレー: 現代のブラウザにおける高度な保護機能を回避し、複数の脆弱性を組み合わせてサンドボックスを脱出するエクスプロイトを自律的に作成した。
  • リバースエンジニアリング: シンボルが削除されたバイナリからソースコードを再構成し、脆弱性を特定する能力を示した。

Nデー脆弱性のエクスプロイト化

既知の脆弱性(Nデー)に対しても、パッチ情報などから極めて短期間で実用的なエクスプロイトを自律的に作成できることが確認された。これにより、パッチ公開から悪用までの時間が大幅に短縮されるリスクが示唆されている。

防御側への提言

言語モデルが大規模かつ高速に脆弱性を特定・悪用できる時代において、防御側も以下の対策を急ぐ必要がある。

  1. 既存モデルの活用: Claude Opus 4.6などの既存モデルでも、脆弱性の特定や修正案の作成、トリアージの自動化に有効である。これらを活用して防御を強化すべきである。
  2. パッチサイクルの短縮: エクスプロイト作成が自動化されるため、セキュリティアップデートの適用をより迅速に行う必要がある。
  3. 脆弱性開示ポリシーの見直し: 言語モデルによって報告される脆弱性の数が激増することに備え、対応パイプラインを自動化・効率化する必要がある。

結論

Claude Mythos Previewは、これまで高度な専門家しか成し得なかったレベルのセキュリティリサーチとエクスプロイト開発を、大規模かつ自律的に実行できることを証明した。Anthropicは、このモデルを一般公開せず、Project Glasswingを通じて重要なインフラの保護を優先する方針である。長期的にはAIが防御側を有利にすると期待されるが、その移行期には従来のセキュリティのあり方を根本から再考する必要がある。


AI Cybersecurity After Mythos: The Jagged Frontier(Mythos後のAIサイバーセキュリティ:ギザギザのフロンティア)

概要 (TL;DR)

Anthropicが発表した高度なセキュリティ特化型AIモデル「Mythos」が発見・攻撃した脆弱性を、安価で小規模なオープンウェイトモデルでテストしたところ、同様の分析結果が得られた。AIのサイバーセキュリティ能力はモデルの規模に比例してスムーズに向上するのではなく、「ギザギザ(jagged)」な分布を示している。結論として、サイバーセキュリティにおける真の「堀(Moat)」はモデルそのものではなく、深いセキュリティ専門知識を組み込んだ「システム(オーケストレーションや検証の仕組み)」にある。


Mythosの発表と背景

2026年4月7日、Anthropicはセキュリティ脆弱性の発見とパッチ適用を目的とした限定公開モデル「Mythos」と、テクノロジー企業によるコンソーシアム「Project Glasswing」を発表した。 Mythosは、Linuxカーネル、ブラウザのサンドボックス、FreeBSD、OpenBSDなどの重要インフラにおいて、長年放置されていたゼロデイ脆弱性を自律的に発見し、高度なエクスプロイト(攻撃コード)を構築できる能力を示した。

AISLEによる検証:能力は「ギザギザ」である

AISLE(著者Stanislav Fort氏のチーム)は、Mythosが成果として挙げた脆弱性を、3.6B〜5.1Bという小規模で安価なオープンモデルで検証した。その結果、以下の事実が判明した:

  • FreeBSDの脆弱性 (CVE-2026-4747): テストした8つのモデルすべてが、スタックバッファオーバーフローを正しく検出した。最も安価なモデル($0.11/1M tokens)でも、クリティカルなRCE(リモートコード実行)の可能性を指摘できた。
  • OpenBSDのSACKバグ: 符号付き整数のオーバーフローを伴う非常に数学的に難解なバグだが、5.1Bのアクティブパラメータを持つモデル(GPT-OSS-120b)が完全な分析を再現した。
  • 逆転現象: OWASPの単純なセキュリティ推論タスクでは、小規模なオープンモデルが大手ラボの最先端(フロンティア)モデルを上回る結果が出た。

これらの結果は、サイバーセキュリティ能力がモデルの規模や価格と比例しない「ギザギザのフロンティア(Jagged Frontier)」であることを示唆している。

AIサイバーセキュリティのパイプライン

AIによるセキュリティ対策は単一の能力ではなく、以下の異なるタスクのモジュール化されたパイプラインである:

  1. 広範囲スキャン: 大規模コードベースのナビゲーション。
  2. 脆弱性検出: 特定のコード内の不備の特定。
  3. トリアージと検証: 真陽性と偽陽性の判別、深刻度の評価。
  4. パッチ生成: 正しい修正案の作成。
  5. エクスプロイト構築: 攻撃の成立性の証明。

Anthropicはこれらを一体化して提示したが、実際には各ステップで必要な「知能」の性質が異なる。

結論:システムこそが「堀」である

AISLEの主張によれば、AIサイバーセキュリティにおける優位性(Moat)は特定のモデルにあるのではなく、それを取り巻くシステム(スカフォールド)にある。

  • 広範囲なカバー: 高価な単一のモデルに頼るのではなく、安価なモデルを大量に配備して網羅的にスキャンし、人間や専門家システムがそれを検証する方が経済的かつ効果的である。
  • 信頼の構築: メンテナ(開発者)に受け入れられる高品質なレポートとパッチを提供できるかどうかが重要である。

AnthropicのMythosはこの分野が現実のものであることを証明したが、それが特定のフロンティアモデルに独占されるべきものではない。防御側(Defenders)が今すぐやるべきことは、オープンなモデルも含めたパイプライン、検証ワークフロー、そして開発プロセスへの統合を構築し始めることである。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment