OpenAIがセキュリティ「Daybreak」を拡張、Five EyesはAIによるサイバー攻撃の脅威が「数ヶ月以内」に迫ると警告

2026年6月25日 00:43

記事提供元：Tech Times

OpenAIは2026年6月22日、サイバーセキュリティ・イニシアチブ「Daybreak」の大幅な拡張を発表した。同日、米国や英国など5カ国のインテリジェンス機関で構成される「Five Eyes」も、最先端AIモデルが数ヶ月以内に攻撃的なサイバー能力を一変させる可能性があるとの共同声明を発表した。AIを活用した防御技術の進化と、それを逆手に取ったサイバー脅威の緊迫化が同時に浮き彫りとなっている。

■ボトルネックは脆弱性の「発見」から「パッチ適用」へ

OpenAIが推進するサイバーセキュリティ・イニシアチブ「Daybreak」の拡張と、国家安全保障上の警告が同日に重なったのは偶然ではない。コードベースを保護する技術そのものが、攻撃手法としても悪用され得るという、AI支援型セキュリティの現状を反映している。

OpenAIが発表した内容には、脆弱性の発見からパッチ適用までを自動化する「Codex Security」プラグインのアップデート、検証済みの防御者向け「GPT-5.5-Cyber」の正式リリース、CiscoやCrowdStrike、Palo Alto Networks、IBMなどが参加する商用パートナープログラム、およびオープンソースのサプライチェーンを保護する「Patch the Planet」イニシアチブの4つが含まれる。

OpenAIの主張によると、3月の研究プレビュー開始以来、Codex Securityは3万以上のコードベースにわたる3000万以上のコミットをスキャンしてきた。その結果、7万件以上の検出結果が手動で解決され、50万件以上が自動で修正されたという。これは、AIが脆弱性を発見するスピードが、人間のセキュリティチームがレビューして修正を適用するスピードを上回っていることを示している。未適用の脆弱性が放置される時間は、そのまま攻撃者にとっての侵入経路となる。

同日、Five Eyes（米、英、加、豪、NZ）のインテリジェンス機関が発表した共同声明「The AI shift in cyber risk: why leaders must act now」も、同様の懸念を示している。声明は、AIによる脅威のタイムラインは「数年ではなく数ヶ月」であると指摘し、組織のリーダーに対してパッチ適用の加速やレガシーシステムの対策、AIの防御運用への統合を急ぐよう促した。

■Codex Securityによる脆弱性発見から修正までの自動化プロセス

Codex Securityは、単独のスキャナーではなく、Codexワークフローに組み込まれたセキュリティエンジニアとして機能する。まず対象コードベースの脅威モデルを構築し、リポジトリ全体を分析して脆弱性を特定する。関数単位ではなく、コード全体の文脈を把握することで、その脆弱なコードパスが実際の運用環境で到達可能かどうかを判断し、ノイズを排除する。

その後、検証証拠を収集してパッチを提案し、脅威モデルに照らして修正を検証する。どのパッチを適用するかなどの最終決定権は人間のレビュー担当者が保持する。また、バグバウンティ報告や外部スキャナーの出力、CVEアドバイザリなどの外部ソースから情報を取り込み、パッチ生成を自動化することも可能だ。

このアーキテクチャは、作業時間を劇的に短縮する。Patch the Planetの最初の取り組みでは、Trail of BitsのエンジニアがCodexとGPT-5.5-Cyberを使用し、主要なオープンソースプロジェクト向けのファジングハーネスを1日足らずで構築した。これは人間の専門家なら2〜3週間かかると推定される作業である。

■GPT-5.5-Cyberのベンチマークと実環境での実績

正式リリースされた「GPT-5.5-Cyber」は、セキュリティワークフローにおける拒否反応を減らすことに焦点を当てていたプレビュー版から大幅に機能が拡張されている。

UCバークレーが開発したベンチマーク「CyberGym」において、GPT-5.5-Cyberは85.6%のスコアを記録し、標準のGPT-5.5（81.8%）を上回った。また、脆弱性を実証コード（PoC）に変換する能力をテストする「ExploitGym」では39.5%（標準は25.95%）、「SEC-bench Pro」では69.8%（標準は63.1%）を記録した。

ただし、これらの数値には技術的な留保が必要である。CyberGymの公開論文によると、標準的な評価環境ではトップクラスの組み合わせでも成功率は約20%にとどまるとされている。OpenAIの85.6%という数値は、同社独自の評価環境と特定のサブセット構成で測定されたものであり、第三者による再現は行われていない。また、ベンチマークの課題が公開データに由来するため、モデルの学習データにそれらが含まれていた「データ汚染」のリスクも指摘されている。OpenAIも「ベンチマークは評価の一部に過ぎない」と認めており、実環境での評価を継続していると言及した。

それでも、ExploitGymでのスコア差が示す通り、GPT-5.5-Cyberは実用的なエクスプロイト（攻撃コード）の生成において高い能力を持つ。そのため、アクセスは「Trusted Access for Cyber」プログラムを通じた本人確認を条件に制限されている。

すでに実環境での実績もあり、Linuxカーネルにおける24件のローカル権限昇格エクスプロイトの発見や、OpenBSDにおける23年前の脆弱性の特定、FreeBSDやdnsmasqにおける複数の脆弱性発見などが報告されている。

■オープンソースのサプライチェーンを守る「Patch the Planet」

「Patch the Planet」は、企業向け製品ではなく、システム全体の脆弱な領域に対処することを目的とした公共の取り組みである。Trail of Bitsと共同設立され、HackerOneやCalifとも協力している。

この取り組みでは、GPT-5.5-CyberによるAI支援型のセキュリティ調査と、Trail of Bitsのエンジニアによる全件レビューを組み合わせる。開発者に報告が届く前に必ず人間が検証する仕組みだ。参加プロジェクトには、Codex SecurityへのアクセスやChatGPT Proアカウント、APIクレジットが提供される。

Linux Foundationなどの調査によると、広く使われているオープンソースプロジェクトの94%は、年間に追加されるコードの9割以上を10人未満の開発者が担当している。AIモデルが大量の脆弱性報告を高速で生成できるようになると、これら少人数の開発チームが対応しきれず、かえってセキュリティ状況が悪化する恐れがある。Patch the Planetはこの課題に直接対処する設計となっている。

すでにcURL、Go、Python、Sigstoreなど30以上の主要なオープンソースプロジェクトが参加している。最初の5日間のスプリントでは、19のプロジェクトに対して64件のプルリクエストと51件の課題提起が行われた。また、OpenAIが安全性評価中に発見したFirefoxの深刻な脆弱性（CVE-2026-8390）は、セキュリティイベント「Pwn2Own Berlin」の2日前に修正され、登録されていたエクスプロイトエントリーの多くが取り下げられる結果となった。

■Daybreakパートナーシップの拡大と今後の課題

Daybreak Cyber Partner Programにより、Cisco、CrowdStrike、Palo Alto Networks、IBMなどのセキュリティベンダーがGPT-5.5を自社製品に組み込めるようになった。また、日本、米国、英国、カナダ、フランス、ドイツ、韓国などの政府機関や、欧州連合サイバーセキュリティ機関（ENISA）とのパートナーシップも拡大している。

GartnerのバイスプレジデントアナリストであるJohn Watts氏は、Daybreakがアプリケーションセキュリティテストなどの分野と直接競合すると指摘し、組織はCodex Securityだけに頼るのではなく、パッチのテストや適用、ロールバックといった修復プロセス全体にリソースを配分すべきだと推奨している。

Five Eyesが提起し、Daybreakがまだ実環境で完全に証明していない未解決の問いは、50万件の修正を自動検証できるパイプラインが、重要インフラを支える実際のコードベースにおいて、パッチの品質や開発者からの信頼を維持できるかという点である。AIが生成したパッチがマシンスピードで本番環境に適用されたときに何が起きるのか、Patch the Planetはその実証実験を公開の場で行っていると言える。

■注目ポイントQ&A

●Patch the Planetとはどのような取り組みですか？

OpenAIがTrail of Bitsと共同設立し、HackerOneやCalifと協力して進めるオープンソースソフトウェア（OSS）向けのセキュリティイニシアチブです。AI支援による脆弱性調査と、人間の専門家による全件レビューを組み合わせ、開発者に負担をかけずにパッチを適用することを目指しています。cURLやPython、Goなどの主要プロジェクトが参加しています。

●Codex Securityはどのようにパッチ生成を自動化するのですか？

対象コードベースの脅威モデルを構築し、リポジトリ全体を分析して脆弱性を特定します。さらに、その脆弱性が実際の運用環境で到達可能かを判断した上でパッチを提案し、検証します。人間が最終的な適用判断を行い、SARIFやCodeQL形式で出力して既存のワークフローと統合できます。

●Five EyesはAIのサイバーセキュリティリスクについてどのような警告を行いましたか？

米国、英国、カナダ、オーストラリア、ニュージーランドの5カ国によるインテリジェンス同盟「Five Eyes」は、2026年6月22日に共同声明を発表しました。最先端のAIモデルが攻撃的・防御的なサイバー能力を「数年ではなく数ヶ月以内」に変貌させると警告し、組織に対してパッチ適用の迅速化やアクセス制限の強化を強く促しています。

●GPT-5.5-Cyberのベンチマークスコアは実環境での性能を正確に示していますか？

OpenAIが発表した高いスコア（CyberGymで85.6%など）は、同社独自の評価環境および特定のサブセットで測定されたものです。標準的な評価環境では成功率が約20%にとどまるとの研究もあり、第三者による再現はされていません。また、訓練データにベンチマーク関連情報が含まれていた「データ汚染」の可能性も指摘されています。

元記事: OpenAI Daybreak Expands Patch Pipeline as Five Eyes Warns AI Attacks Are Months Away

※この記事はTech Timesから提供を受けた記事を日本向けに翻訳・編集したものです。

スポンサードリンク