ホーム » ペネトレーションテスト » 大規模言語モデル（LLM）ペネトレーションテスト

大規模言語モデル（LLM）ペネトレーションテスト

LLM Penetration Testing

生成AIが生み出した、
新たなセキュリティリスクの対策

大規模言語モデル（LLM）の活用は、「プロンプトインジェクション」のような、新たなセキュリティリスクをもたらしました。
私たち CyberCrew は、この新しい脅威に対し、専門的なペネトレーションテストを提供します。
OWASP Top 10 for LLM Applications など最新の脅威モデルに基づき、
専門家チームがお客様のAIシステムを診断し、安全なAI活用を支援します。

こんな不安、ありませんか？

大規模言語モデル（LLM）ペネトレーションテスト
サービスの特徴

LLM特有の脆弱性への専門的アプローチ

「プロンプトインジェクション」やデータ漏洩、サービス拒否（DoS）攻撃など
LLMアプリケーション特有の脆弱性を専門家の視点で深く掘り下げて評価

高度な手動テスト

自動化ツールでは検出が困難な、文脈に依存する巧妙な攻撃シナリオ
専門家による手動でテストで評価

開発・運用に直結する具体的な改善提案

プロンプト設計の見直し、出力フィルタリング、ガードレールの強化など
具体的な対策を提示

LLM特有の脆弱性への専門的アプローチ

「プロンプトインジェクション」やデータ漏洩、サービス拒否（DoS）攻撃など
LLMアプリケーション特有の脆弱性を専門家の視点で深く掘り下げて評価。

構成を問わず対応

チャットボット、RAG、API連携、オンプレモデルなど、あらゆるLLM活用サービスに対応。

ホワイトハッカーによる攻撃設計

お客様の懸念点を起点に、専門チームが実戦的な攻撃シナリオを設計。

経営・技術両層に向けたレポート

全体リスクと技術詳細を分けて提示。対応方針の意思決定に活用いただけます。

大規模言語モデル（LLM）ペネトレーションテストの
主なテスト領域

私たちは、お客様のLLM活用におけるセキュリティリスクを多角的に評価するため、以下の主要な領域に焦点を当ててテストを実施します。

プロンプトインジェクションテスト

LLMへの指示を上書き・改ざんし、不正な操作を実行させる攻撃、それによるガードレールの回避、内部情報の漏洩、なりすましなどを検証

データ漏洩・プライバシー侵害テスト

モデルが学習したデータに含まれる個人情報や機密情報などの漏洩しないかを検証

不適切な出力・有害コンテンツ生成テスト

LLMが差別的、暴力的、非倫理的、あるいは法的に問題のあるコンテンツを生成しないかを評価。企業のブランドイメージや社会的信用を守るための重要な評価項目です。

サービス拒否（DoS）攻撃耐性テスト

リソースを大量に消費させるような特定のプロンプトを送信して影響を検証

間接的プロンプトインジェクション・プラグイン脆弱性テスト

LLMが外部のデータソースや、外部ツール（プラグイン）と連携する場合、それらを経由して不正な指示が注入されるリスクを評価。

大規模言語モデル（LLM）ペネトレーションテストで
検証されるリスクの例

プロンプトインジェクション（命令逸脱）
学習データ由来の情報漏洩
外部APIの悪用（Plugin・Zapier経由）
認証回避、アクセス制御ミス
高負荷入力によるDoS

大規模言語モデル（LLM）ペネトレーションテストの
診断の流れ

ヒアリング

守りたい情報・対象範囲を明確化
攻撃シナリオの設計

攻撃者視点でシナリオ策定、具体ステップに分解
脆弱性診断

スキャン＋ホワイトハッカーによる精密検証
シナリオ実行と結果取得

攻撃フローを順に再現し、影響を確認します。
報告書提出・フィードバック

経営者向けのサマリー・技術者向け詳細説明を含む報告書を作成し提出します。ご要望に応じて報告会を実施いたします。

大規模言語モデル（LLM）ペネトレーションテスト
導入のタイミング

導入タイミング	推奨される攻撃シナリオ	目的
新規サービスのリリース前	プロンプトインジェクション / 学習データ由来の漏洩	重大な情報漏洩リスクの排除
大規模アップデート前	外部APIの悪用 / 設定ミスによる認証回避	設計変更による新たな盲点の確認
資金調達・監査直前	リスク可視化 / 被害影響の整理	レポート資料としての信頼性向上
社内利用範囲の拡大前	DoS攻撃シナリオ / 認可の漏れ	運用面でのリスク最小化とトラブル防止
年次セキュリティチェック	総合的な攻撃シナリオ検証	全体的な耐性チェック・改善策の整理

大規模言語モデル（LLM）ペネトレーションテスト
適用ガイドライン・参考フレームワーク

私たちのLLMペネトレーションテストは、以下の国際的なセキュリティフレームワークやベストプラクティスを参考に実施されます。

OWASP Top 10 for LLM Applications: LLMアプリケーションにおける主要な10大リスク。
MITRE ATLAS™ (Adversarial Threat Landscape for Artificial-Intelligence Systems): AIシステムに対する敵対的脅威のランドスケープと戦術。
NIST AI Risk Management Framework (AI RMF): AIのリスク管理に関するガイドライン。
その他、最新の学術論文や研究コミュニティの知見。

大規模言語モデル（LLM）ペネトレーションテストの
期待される効果 / お客様が得られるベネフィット

当社のソーシャルエンジニアリングテストにより、お客様は以下の効果とベネフィットを得られます。

当社のLLMペネトレーションテストにより、お客様は以下の効果とベネフィットを得られます。
LLM活用における未知のセキュリティリスクの可視化と対策。
プロンプトインジェクション等による情報漏洩やサービス悪用の防止。
AIの不適切な応答によるブランドイメージ毀損リスクの低減。
安全で信頼性の高いAIサービスの提供による、顧客信頼の獲得。
AI倫理や社会的責任（Responsible AI）への取り組み強化。
開発チームや運用チームに対する、セキュアなAI開発・運用ガイドラインの提供。
先進的なAI技術を、セキュリティ不安なくビジネスに活用できる体制の構築。

大規模言語モデル（LLM）ペネトレーションテストの
よくあるご質問

どのようなLLMが診断対象ですか？

GPT、およびオープンソースのLLM（Llama、Mistral等）など、主要な大規模言語モデルを組み込んだアプリケーションに対応しています。

自社でファインチューニングしたモデルも診断できますか？

はい、可能です。お客様が独自にファインチューニングしたモデル特有の挙動やリスクについても評価いたします。

API経由でLLMを利用している場合でもテストは可能ですか？

はい、可能です。APIを介したLLMとの対話における脆弱性を中心にテストを実施します。多くのお客様がこの形態で利用されています。

診断にはどのような情報が必要ですか？

対象アプリケーションのURLやアクセス情報、可能であればAPI仕様書、アプリケーションの概要や想定されるユースケースに関する情報をご提供いただけますと、より精度の高いテストが可能です。

テストによってLLMの学習内容やシステムに悪影響は出ませんか？

私たちは、お客様のシステムやデータに恒久的な損害を与えないよう、安全な範囲でテストを実施します。攻撃的なテストについては、事前にお客様と内容と範囲について詳細な合意を形成します。可能な場合は検証環境での実施を推奨します。

その他の診断サービス

モバイルアプリケーション | サイバーセキュリティの株式会社CyberCrew（サイバークルー）

モバイルアプリケーションペネトレーションテスト

モバイルアプリケーションペネトレーションテストは、スマートフォンやタブレットで利用されるモバイルアプリケーションに特化した侵入テストサービスです。アプリケーションの設計、構成、データ通信、保存領域、認証機構などを多角的に検証し、実際の攻撃を想定した高精度な脆弱性評価を実施します。

脆弱性診断サービス

CyberCrewの脆弱性診断サービスは、自動ツールを活用した「スピーディかつリーズナブルな診断」により、企業のセキュリティ状況を可視化します。なお、当社の「ペネトレーションテスト」サービスには、この脆弱性診断が前提工程として含まれており、攻撃シナリオ設計や実行前にリスクを網羅的に把握することを目的として活用されます。

大規模言語モデル（LLM）ペネトレーションテスト

生成AIが生み出した、
新たなセキュリティリスクの対策

こんな不安、ありませんか？

大規模言語モデル（LLM）ペネトレーションテスト
サービスの特徴

LLM特有の脆弱性への専門的アプローチ

最新の脅威モデルへの準拠

高度な手動テスト

開発・運用に直結する具体的な改善提案

LLM特有の脆弱性への専門的アプローチ

構成を問わず対応

ホワイトハッカーによる攻撃設計

経営・技術両層に向けたレポート

大規模言語モデル（LLM）ペネトレーションテストの
主なテスト領域

プロンプトインジェクションテスト

データ漏洩・プライバシー侵害テスト

不適切な出力・有害コンテンツ生成テスト

サービス拒否（DoS）攻撃耐性テスト

間接的プロンプトインジェクション・プラグイン脆弱性テスト

大規模言語モデル（LLM）ペネトレーションテストで
検証されるリスクの例

大規模言語モデル（LLM）ペネトレーションテストの
診断の流れ

ヒアリング

攻撃シナリオの設計

脆弱性診断

シナリオ実行と結果取得

報告書提出・フィードバック

大規模言語モデル（LLM）ペネトレーションテスト
導入のタイミング

大規模言語モデル（LLM）ペネトレーションテスト
適用ガイドライン・参考フレームワーク

大規模言語モデル（LLM）ペネトレーションテストの
期待される効果 / お客様が得られるベネフィット

大規模言語モデル（LLM）ペネトレーションテストの
よくあるご質問

その他の診断サービス

Webアプリケーションペネトレーションテスト

モバイルアプリケーションペネトレーションテスト

クラウドペネトレーションテスト

ネットワークペネトレーションテスト

シナリオ型ペネトレーションテスト

ソーシャルエンジニアリングテスト

大規模言語モデル（LLM）ペネトレーションテスト

脆弱性診断サービス

大規模言語モデル（LLM）ペネトレーションテスト

生成AIが生み出した、新たなセキュリティリスクの対策

こんな不安、ありませんか？

大規模言語モデル（LLM）ペネトレーションテストサービスの特徴

LLM特有の脆弱性への専門的アプローチ

最新の脅威モデルへの準拠

高度な手動テスト

開発・運用に直結する具体的な改善提案

LLM特有の脆弱性への専門的アプローチ

構成を問わず対応

ホワイトハッカーによる攻撃設計

経営・技術両層に向けたレポート

大規模言語モデル（LLM）ペネトレーションテストの主なテスト領域

プロンプトインジェクションテスト

データ漏洩・プライバシー侵害テスト

不適切な出力・有害コンテンツ生成テスト

サービス拒否（DoS）攻撃耐性テスト

間接的プロンプトインジェクション・プラグイン脆弱性テスト

大規模言語モデル（LLM）ペネトレーションテストで検証されるリスクの例

大規模言語モデル（LLM）ペネトレーションテストの診断の流れ

ヒアリング

攻撃シナリオの設計

脆弱性診断

シナリオ実行と結果取得

報告書提出・フィードバック

大規模言語モデル（LLM）ペネトレーションテスト導入のタイミング

大規模言語モデル（LLM）ペネトレーションテスト適用ガイドライン・参考フレームワーク

大規模言語モデル（LLM）ペネトレーションテストの期待される効果 / お客様が得られるベネフィット

大規模言語モデル（LLM）ペネトレーションテストのよくあるご質問

その他の診断サービス

生成AIが生み出した、
新たなセキュリティリスクの対策

大規模言語モデル（LLM）ペネトレーションテスト
サービスの特徴

大規模言語モデル（LLM）ペネトレーションテストの
主なテスト領域

大規模言語モデル（LLM）ペネトレーションテストで
検証されるリスクの例

大規模言語モデル（LLM）ペネトレーションテストの
診断の流れ

大規模言語モデル（LLM）ペネトレーションテスト
導入のタイミング

大規模言語モデル（LLM）ペネトレーションテスト
適用ガイドライン・参考フレームワーク

大規模言語モデル（LLM）ペネトレーションテストの
期待される効果 / お客様が得られるベネフィット

大規模言語モデル（LLM）ペネトレーションテストの
よくあるご質問