ならばチート行為に AI を、と考える輩(やから)もでてくる。この場合、単純にプレーヤーを AI 化して負けないようにするだけでなく、敵や環境を、制御する AI に誤認識させる AI も研究されている。
ペンシルバニア州立大学の Xinyu Xing 氏らのチームは DRL を利用してゲームに(異常に高い確率で)勝つ AI ボットを研究している。本稿は昨夏オンライン開催された Black Hat USA 2020 の講演の抄録だ。なお、本年の Black Hat USA 2021 はハイブリッド開催される。
●深層強化学習ゲームへの攻撃
さて、DRL は、ゲームのようなモデル化された環境であるほど高い効果を発揮する。無敵のブロック崩しプレーヤーの研究、囲碁有段者でも勝てない AlphaGo・OpenGo、名うてのポーカープレーヤーの心理戦が通用しない Texas hold'em などは、どれも DRL で実装された AI ボットだ。StarCraft II や Dota 2 のようなリアルタイムシミュレーションゲームでも、敵キャラの動きなどに DRL が利用されている。
一般的に DRL や機械学習( ML )への攻撃は、トレーニングフェーズの段階に汚染データを注入して学習を妨害する方法や、入力データに細工をしてニューラルネットワークの評価処理に摂動(相互作用)を引き起こさせる方法が知られている。後者のデータに施す細工は人間には知覚できないが、AI の処理には影響を及ぼす。たとえば、バナナ(に見える)の画像を自動車や別のものに認識させる手法だ。