独立行政法人情報処理推進機構(IPA)は4月2日、「AIセーフティに関するレッドチーミング手法ガイド」の改訂を発表した。
IPAのAIセーフティ・インスティテュート(AISI)で2024年9月に公開した「AIセーフティに関するレッドチーミング手法ガイド」は、AIシステムの開発者や提供者が、対象のAIシステムに施したリスクへの対策を、攻撃者の視点から評価するためのレッドチーミング手法に関する基本的な考慮事項を示すもの。レッドチーミングの実施には高い専門性が求められるため、より実践的なガイドにする必要があった。
今回の改訂で、Retrieval-Augmented Generation(RAG)の仕組みを実装したAIシステムに対し実際にレッドチーミングを行い、その手順を詳細に解説するとともに、レッドチーミング実施の成果物を文書としてとりまとめている。
「AIセーフティに関するレッドチーミング手法ガイド」の改訂後の構成は下記の通り。
1.本編
レッドチーミング手法に関する基本的な考慮事項を体系的に記載
2.別紙(詳細解説書)
本編に沿ってレッドチーミングを実施する際の実施ポイントや各工程での成果物例を解説
3.別添(成果物例)
本編に沿ってレッドチーミングを実施する際に作成する成果物の一部を例として示している
1.リスクシナリオと攻撃シナリオの作成及び攻撃シナリオの実施結果
2.レッドチーミング実施結果報告書
3.最終報告書
日本語版の資料に加え、英語版を含む「AIセーフティに関するレッドチーミング手法ガイド」の文書はAISIのウェブサイトからダウンロード可能。