ライブの大学ネットワークテストにおいて、ARTEMISは人間のペンテスターと比較してどのようなパフォーマンスを示しましたか？

ARTEMISはライブトライアルで際立った成果を上げ、82%の検証率で9つの有効な脆弱性を特定し、全体で2位、10人中9人のプロのテスターを上回りました。このテストは約12のサブネットにまたがる約8,000のホストを対象としており、本番環境に近い条件下でのARTEMISの規模と自動化された有効性を浮き彫りにしました。

ARTEMISはどのような構造になっており、そのコンポーネントはどのような役割を果たしていますか？

ARTEMISは単一のモデルではなく、小さなエコシステムです。最上位のスーパーバイザーがタスクの計画と委任を行い、サブエージェントのスウォーム（群れ）がスキャン、エクスプロイト、情報収集などの標的を絞ったアクションを実行し、トリアージモジュールが報告前に候補となる発見事項を検証します。動的なプロンプト生成とサブエージェントのオンザフライでの再構成により、ARTEMISに幅広さ、持続性、適応性を与えています。

トライアルにおけるARTEMISの主な強みは何ですか？

ARTEMISの強みは、規模、持続性、そして体系的な列挙にあります。数千の偵察スレッドを並行して実行し、疲労することなく数時間にわたるキャンペーンを継続し、多くのターゲットを徹底的に調査できます。このアプローチにより、結果の迅速な再結合や日常的な発見作業の重労働が可能になり、高度なコンテキストを必要とする意思決定や修正は人間の防御側に委ねることで、効果的なフォースマルチプライヤー（戦力倍増因子）として機能します。

ARTEMISの限界や顕著な失敗パターンは何でしたか？

ARTEMISには、優秀な人間のテスターよりも誤検知率が高いことや、GUIを多用するフローやインタラクティブなウェブインターフェースへの対応が困難であることなど、顕著な限界が見られました。顕著な例として、重大なリモートコード実行（RCE）の脆弱性においてウェブベースの管理UIの操作が必要だった際、人間のテスターの80%が成功した一方で、ARTEMISはエクスプロイトの再現に失敗し、深刻度の低い発見を報告するにとどまりました。認識と行動のギャップが、これらの弱点の根底にあります。

コストへの影響とポリシー上の考慮事項は何ですか？

コストとポリシーへの影響は衝撃的でした。最も効率的なARTEMISの構成では、クラウド推論とオーケストレーションに1時間あたり約18.21ドルかかりますが、これはプロのペンテスターの基準である1時間あたり約60ドルを大幅に下回っています。コストの削減により、継続的な自動レッドチームの運用が可能になりますが、緩和策や責任ある公開慣行がないまま、エージェントAIを攻撃的なキャンペーンに転用するというデュアルユース（軍民両用）の懸念も生じています。

スタンフォード大の研究：AI「Artemis」がペンテスターの9割を凌駕

ARTEMIS、実戦環境の試験で人間のペネトレーションテスターの大半を凌駕

今月、約8,000台のホストを抱える広大な大学ネットワークに対して、ノートパソコンのクラスターとスクリプトが並ぶ端末が調査を開始した。侵入者の正体は、週末に活動する人間のハッカー集団ではない。それは、Stanford大学の研究チームが開発し、Carnegie Mellon大学および業界パートナーのGray Swan AIと共同でテストを実施したマルチエージェント人工知能システム「ARTEMIS」であった。今週プレプリントサーバーに投稿された論文によると、ARTEMISは競技全体で2位にランクインし、82%の妥当性率で9件の検証済み脆弱性レポートを作成。プロの人間ペネトレーションテスター10人のうち9人を上回る成績を収めた。

この実験は、運用中の本番環境に近い設定で、エージェント型AIレッドチームツールと熟練した人間の専門家を大規模に直接対決させた初の結果の一つである。この環境設定は重要である。シミュレーションによるベンチマークでは省略されがちなノイズ、認証の特異性、対話的なUI要素にAIがさらされたからだ。その結果、自律型セキュリティエージェントがすでに人間に匹敵、あるいは凌駕している部分と、依然として及ばない部分がより鮮明になった。

ARTEMISのアーキテクチャとワークフロー

ARTEMISは単一の巨大なモデルではなく、小さなエコシステムである。最上位には計画と委譲を行うスーパーバイザー（監視役）が位置し、その下でスキャン、エクスプロイトの試行、情報収集などの特定のタスクを実行するサブエージェント群が群れをなして活動する。そして、トリアージモジュールが報告前に候補となる発見事項を検証する。研究チームは、動的なプロンプト生成、短期間のスペシャリストとして調整された任意のサブエージェント、および自動化された脆弱性トリアージを、ARTEMISに幅広さと持続性をもたらす核心的な革新技術として挙げている。

このマルチエージェント構成により並列処理が可能になり、ARTEMISは人間が直面する休憩やリソースの制約なしに、多くの偵察およびエクスプロイトのスレッドを同時に実行できる。また、この設計によりサブエージェントを動的に再構成することも可能だ。あるアプローチが行き詰まると、別のプロンプトとより狭い任務を持った別のエージェントが即座に起動される。特にトリアージ段階は重要であり、明らかな誤検知をフィルタリングして発見事項のS/N比（信号対雑音比）を向上させる。これは、より単純な自動スキャナーに頻繁に見られる弱点である。

ライブトライアル：規模、スコアリング、コスト

フィールド試験は、12のサブネットと数千台のデバイスに及ぶ大学ネットワークで実施された。従来のベンチマーク形式の評価と比較して、研究チームは現実的な運用コンテキストでエージェントをテストするために、あえてこの環境を選択した。ARTEMISは9件の有効な脆弱性を特定し、提出物に対して82%の検証率を達成した。この組み合わせにより、競技全体で2位となり、ほとんどの人間の参加者を上回った。

コスト面でも驚くべき結果が出た。研究者によると、最も効率的なARTEMISの構成（A1と表記）は、クラウド推論およびオーケストレーションのコストを含めて1時間あたり約18.21ドルで動作する。これは、本研究がベースラインとして引用しているプロのペネトレーションテスターの市場価格（1時間あたり約60ドル）を大幅に下回っている。純粋な経済性の観点から示唆されることは明らかだ。組織は今後、人件費の数分の一のコストで、継続的かつ自動化されたレッドチームを運用できる可能性がある。

強み：規模、持続性、体系的な列挙

ARTEMISは、人間のチームが太刀打ちするのが難しい利点を示している。数千のホストにわたる体系的な列挙、疲労することのない数時間に及ぶ継続的なキャンペーン、そして複数のターゲットへの同時調査において優れている。人間のテスターが優先順位を付けて順次進めなければならない場面でも、ARTEMISは多くの調査ラインを並列化し、結果を迅速に再結合できる。日常的なアタックサーフェスの発見、設定ミスのチェック、パターンベースのエクスプロイトにおいて、このエージェントは繰り返し、より迅速かつ網羅的であった。

これらの特徴により、ARTEMISはセキュリティチームの戦力倍増ツールとして魅力的なものとなっている。重く反復的な作業をAIが担当し、高度な文脈判断や複雑な修復作業を人間に委ねることができるからだ。

限界と失敗のパターン

輝かしいパフォーマンスの一方で、ARTEMISには顕著な弱点も見られた。最良の人間のテスターよりも誤検知率が高く、GUIを多用するフローや対話型のウェブインターフェースに苦戦した。論文では顕著な例が挙げられている。ある重大なリモートコード実行（RCE）の脆弱性において、ウェブベースの管理UIを操作する必要があった際、人間のテスターの80%がエクスプロイトに成功したが、ARTEMISはエクスプロイトを再現できず、代わりに深刻度の低い発見事項を報告するにとどまった。

これらの制限は、認識と行動のギャップに起因している。言語モデルやプロンプト駆動型のエージェントは、テキストベースの推論やスクリプト生成には強いが、ピクセルレベルのインタラクション、タイミング、または予測不可能なフロントエンドロジックが必要な場面では脆さを見せる。また、この研究はデュアルユース（二重用途）の懸念も指摘している。緩和策や責任ある公開慣行が徹底されなければ、オープンソース化された強力なレッドチームエージェントが悪意のあるアクターによって転用される可能性がある。

他のAIエージェントとの比較

研究チームは、ARTEMISを他のエージェントフレームワーク（論文内の例では初期の単一エージェントシステムや言語モデルのみに基づく実装など）と比較した。以前に評価されたエージェントを含むこれらの代替案は、ほとんどの人間の参加者やARTEMISのマルチエージェント構成と比較して、パフォーマンスが劣っていた。本研究は、ARTEMISの優位性は、単なるモデルのサイズではなく、スーパーバイザー／サブエージェント／トリアージのパターンと動的なタスク割り当てにあるとしている。

防御者、攻撃者、および政策への影響

実用面での教訓は複雑である。一方で、ARTEMIS型のツールは、防御者が問題を早期に、安価に、および大規模に発見する能力を劇的に向上させる可能性がある。組織は、自動化されたレッドチームを継続的なセキュリティパイプラインに統合し、容易に悪用可能な設定ミスを迅速に表面化させ、パッチ適用作業の優先順位をより効果的に決定できるようになる。その一方で、同じ機能が攻撃の自動化の障壁を下げることにもなる。エージェント型AIの支援を受けたスキルの低い攻撃者が、以前は協調した人間のチームを必要としたような、広範かつ迅速なキャンペーンを展開できるようになる恐れがある。

このデュアルユースの性質は、リスクを軽減しながら防御価値を引き出す方法という、現在業界や政策サークルで展開されている広範な議論と一致している。研究チームは、透明性を高め、防御を加速させるために、成果物やオープンソースのコンポーネントを公開した。彼らのアプローチは明らかに現実的である。防御者は管理された環境でエージェント型ツールの実験を行うべきであり、一方でプラットフォームやクラウドのプロバイダー、標準化団体、規制当局は、安全なリリースと悪用検知のためのガードレールの整備に取り組むべきである。

チームはどう対応すべきか

セキュリティリーダーにとって、直ちにとるべきステップは明確だ。第一に、自動化されたエージェントを人間に取って代わるものではなく、人間の専門知識を補完するツールとして扱うこと。これらを利用して対象範囲を広げ、発見を加速させる一方で、文脈、判断、創造的な問題解決が必要な場面では、人間のトリアージとエクスプロイトを維持すること。第二に、エージェント型ワークフローによる攻撃者の利用を特定するために、テレメトリと異常検知を強化すること。第三に、AIのスピードと人間の判断を組み合わせた、ヒューマン・イン・ザ・ループ（人間が介在する）プロセスとレッドチームのオーケストレーションに投資すること。

最後に、業界関係者は、責任ある公開フレームワーク、現実の運用の複雑さを反映した標準化されたベンチマーク、およびエージェントの速度での運用に調整された脅威共有メカニズムについて協力すべきである。

ARTEMISは明確な転換点を示している。自律型エージェントはもはや研究室の珍品ではない。管理された試験において、それらは大規模ネットワーク上でほとんどの人間のテスターよりも多くの発見をし、継続的かつ安価に動作し、日常的な攻撃的セキュリティ業務のあり方を変貌させることができる。しかし、それらはまた、現在のAIに残された境界線、すなわちGUI操作、微妙なエクスプロイト、および人間の創造性が依然として支配する最後の10–20%の問題解決を可視化している。次の段階は、これらのエージェントを、防御側に利益をもたらすように設計されたチームやシステムの中で機能させることにあるだろう。

情報源

arXiv（ARTEMISマルチエージェントペネトレーションテストに関する研究論文）
Stanford University（研究チームおよび学習資料）
Carnegie Mellon University（共同研究者）
Gray Swan AI（業界パートナーおよびツール提供）

AI「ARTEMIS」、ペネトレーションテスターの90%を凌駕

ARTEMIS、実戦環境の試験で人間のペネトレーションテスターの大半を凌駕

ARTEMISのアーキテクチャとワークフロー

ライブトライアル：規模、スコアリング、コスト

強み：規模、持続性、体系的な列挙

限界と失敗のパターン

他のAIエージェントとの比較

防御者、攻撃者、および政策への影響

チームはどう対応すべきか

情報源

Tags

Mattias Risberg

Readers Questions Answered

Have a question about this article?

Comments