大規模言語モデル(LLM)ペネトレーションテスト

LLM Penetration Testing

生成AIが生み出した、
新たなセキュリティリスクの対策

大規模言語モデル(LLM)の活用は、「プロンプトインジェクション」のような、新たなセキュリティリスクをもたらしました。
私たち CyberCrew は、この新しい脅威に対し、専門的なペネトレーションテストを提供します。
OWASP Top 10 for LLM Applications など最新の脅威モデルに基づき、
専門家チームがお客様のAIシステムを診断し、安全なAI活用を支援します。

こんな不安、ありませんか?

経済産業省 情報セキュリティサービス基準 019-0026-10

経済産業省が定める「情報セキュリティサービス基準」に基づく登録サービス

サービス名:ペネトレーションテストサービス/脆弱性診断サービス

大規模言語モデル(LLM)ペネトレーションテスト
サービスの特徴

LLM特有の脆弱性への専門的アプローチ

  • 「プロンプトインジェクション」やデータ漏洩、サービス拒否(DoS)攻撃など
  • LLMアプリケーション特有の脆弱性を専門家の視点で深く掘り下げて評価

最新の脅威モデルへの準拠

  • OWASP Top 10 for LLM ApplicationsやMITRE ATLAS™など、最新の脅威フレームワーク
  • 体系的かつ網羅的なテストを実施

高度な手動テスト

  • 自動化ツールでは検出が困難な、文脈に依存する巧妙な攻撃シナリオ
  • 専門家による手動でテストで評価

開発・運用に直結する具体的な改善提案

  • プロンプト設計の見直し、出力フィルタリング、ガードレールの強化など
  • 具体的な対策を提示

LLM特有の脆弱性への専門的アプローチ

  • 「プロンプトインジェクション」やデータ漏洩、サービス拒否(DoS)攻撃など
  • LLMアプリケーション特有の脆弱性を専門家の視点で深く掘り下げて評価。

構成を問わず対応

チャットボット、RAG、API連携、オンプレモデルなど、あらゆるLLM活用サービスに対応。

ホワイトハッカーによる攻撃設計

お客様の懸念点を起点に、専門チームが実戦的な攻撃シナリオを設計。

経営・技術両層に向けたレポート

全体リスクと技術詳細を分けて提示。対応方針の意思決定に活用いただけます。

大規模言語モデル(LLM)ペネトレーションテストの
主なテスト領域

私たちは、お客様のLLM活用におけるセキュリティリスクを多角的に評価するため、以下の主要な領域に焦点を当ててテストを実施します。

プロンプトインジェクションテスト

LLMへの指示を上書き・改ざんし、不正な操作を実行させる攻撃、それによるガードレールの回避、内部情報の漏洩、なりすましなどを検証

データ漏洩・プライバシー侵害テスト

モデルが学習したデータに含まれる個人情報や機密情報などの漏洩しないかを検証

不適切な出力・有害コンテンツ生成テスト

LLMが差別的、暴力的、非倫理的、あるいは法的に問題のあるコンテンツを生成しないかを評価。 企業のブランドイメージや社会的信用を守るための重要な評価項目です。

サービス拒否(DoS)攻撃耐性テスト

リソースを大量に消費させるような特定のプロンプトを送信して影響を検証

間接的プロンプトインジェクション・プラグイン脆弱性テスト

LLMが外部のデータソースや、外部ツール(プラグイン)と連携する場合、それらを経由して不正な指示が注入されるリスクを評価。

大規模言語モデル(LLM)ペネトレーションテストで
検証されるリスクの例

大規模言語モデル(LLM)ペネトレーションテストの
診断の流れ

  • ヒアリング

    守りたい情報・対象範囲を明確化

  • 攻撃シナリオの設計

    攻撃者視点でシナリオ策定、具体ステップに分解

  • 脆弱性診断

    スキャン+ホワイトハッカーによる精密検証

  • シナリオ実行と結果取得

    攻撃フローを順に再現し、影響を確認します。

  • 報告書提出・フィードバック

    経営者向けのサマリー・技術者向け詳細説明を含む報告書を作成し提出します。 ご要望に応じて報告会を実施いたします。

大規模言語モデル(LLM)ペネトレーションテスト
導入のタイミング

導入タイミング 推奨される攻撃シナリオ 目的
新規サービスのリリース前
プロンプトインジェクション / 学習データ由来の漏洩
重大な情報漏洩リスクの排除
大規模アップデート前
外部APIの悪用 / 設定ミスによる認証回避
設計変更による新たな盲点の確認
資金調達・監査直前
リスク可視化 / 被害影響の整理
レポート資料としての信頼性向上
社内利用範囲の拡大前
DoS攻撃シナリオ / 認可の漏れ
運用面でのリスク最小化とトラブル防止
年次セキュリティチェック
総合的な攻撃シナリオ検証
全体的な耐性チェック・改善策の整理

大規模言語モデル(LLM)ペネトレーションテスト
適用ガイドライン・参考フレームワーク

私たちのLLMペネトレーションテストは、以下の国際的なセキュリティフレームワークやベストプラクティスを参考に実施されます。

大規模言語モデル(LLM)ペネトレーションテストの
期待される効果 / お客様が得られるベネフィット

当社のソーシャルエンジニアリングテストにより、お客様は以下の効果とベネフィットを得られます。

大規模言語モデル(LLM)ペネトレーションテストの
よくあるご質問

どのようなLLMが診断対象ですか?

GPT、およびオープンソースのLLM(Llama、Mistral等)など、主要な大規模言語モデルを組み込んだアプリケーションに対応しています。

自社でファインチューニングしたモデルも診断できますか?

はい、可能です。お客様が独自にファインチューニングしたモデル特有の挙動やリスクについても評価いたします。

API経由でLLMを利用している場合でもテストは可能ですか?

はい、可能です。APIを介したLLMとの対話における脆弱性を中心にテストを実施します。多くのお客様がこの形態で利用されています。

診断にはどのような情報が必要ですか?

対象アプリケーションのURLやアクセス情報、可能であればAPI仕様書、アプリケーションの概要や想定されるユースケースに関する情報をご提供いただけますと、より精度の高いテストが可能です。

テストによってLLMの学習内容やシステムに悪影響は出ませんか?

私たちは、お客様のシステムやデータに恒久的な損害を与えないよう、安全な範囲でテストを実施します。攻撃的なテストについては、事前にお客様と内容と範囲について詳細な合意を形成します。可能な場合は検証環境での実施を推奨します。

その他の診断サービス

Webアプリケーション | サイバーセキュリティの株式会社CyberCrew(サイバークルー)

Webアプリケーション ペネトレーションテスト

Webアプリケーション ペネトレーションテストは、ウェブサイトやウェブサービスなどのWebアプリケーションに特化した侵入テストサービスです。ホワ イトハッカーを擁するCyberCrew は、最新の脆弱性に対応したWebアプリ ケーション向けのペネトレーションテスト(侵入テスト)を提供しています。

モバイルアプリケーション | サイバーセキュリティの株式会社CyberCrew(サイバークルー)

モバイルアプリケーション ペネトレーションテスト

モバイルアプリケーション ペネトレーションテストは、スマートフォンやタブレットで利用されるモバイルアプリケーションに特化した侵入テストサービスです。アプリケーションの設計、構成、データ通信、保存領域、認証機構などを多角的に検証し、実際の攻撃を想定した高精度な脆弱性評価を実施します。

クラウドアプリケーション | サイバーセキュリティの株式会社CyberCrew(サイバークルー)

クラウド ペネトレーションテスト

クラウド ペネトレーションテストは、AWS、Azure、GCPなどのクラウド環境に特化した侵入テストサービスです。企業が利用するクラウド基盤に対して、実際の攻撃者を模した手法で脆弱性を検出し、重要なデータ資産の保 護を支援します。

ネットワークアプリケーション | サイバーセキュリティの株式会社CyberCrew(サイバークルー)

ネットワーク ペネトレーションテスト

ネットワーク ペネトレーションテスト(侵入テスト)は、企業のネットワークインフラに存在する脆弱性を特定し、攻撃者による不正アクセスや情報漏洩リスクを未然に防ぐことを目的としたセキュリティ評価サービスです。

診断サービス | サイバーセキュリティの株式会社CyberCrew(サイバークルー)

シナリオ型ペネトレーションテスト

業務や組織構造を踏まえてカスタム設計された“攻撃シナリオ”に沿って、 実際の攻撃フローを模擬的に実行。内部感染、権限昇格、情報持ち出しなど、 "攻撃の現実性"と"被害の広がり"を横断的に評価します。

ソーシャルエンジニアリングペネトレーションテスト

ソーシャルエンジニアリング テスト

人を標的にした攻撃(フィッシング・なりすまし・情報詐取など)を通じて、組織の「人と仕組み」の脆弱性を検証するテストです。物理侵入や電話を用いた疑似攻撃にも対応し、セキュリティポリシーの有効性や、従業員の対応力を評価します。

大規模言語モデル(LLM)ペネトレーションテスト

大規模言語モデル(LLM)ペネトレーションテスト

ChatGPTなどのLLM(大規模言語モデル)を活用したシステムに対して、プロンプトインジェクションや情報漏洩、脱検閲の再現を通じ、AIを介した攻撃経路の存在や被害範囲を検証するテストです。 API・チャットUI・外部連携など、実運用に近い条件で評価を行います。

脆弱性診断サービス

CyberCrewの脆弱性診断サービスは、自動ツールを活用した「スピーディかつリーズナブルな診断」により、企業のセキュリティ状況を可視化します。 なお、当社の「ペネトレーションテスト」サービスには、この脆弱性診断が前提工程として含まれており、 攻撃シナリオ設計や実行前にリスクを網羅的に把握することを目的として活用されます。


Page Top