オンラインシミュレーションゲームを人工知能でチートする研究

　オンラインシミュレーションゲームには「深層強化学習（ Deep Reinforcement Learning：DRL ）」といった AI 技術が投入されている。プレーヤーはただのアルゴリズムを相手にしているのではなく AI と対戦しているといってもよい。また、チート行為を検出する目的でも AI が活用されている。どちらも AI との戦いだ。

　ならばチート行為に AI を、と考える輩（やから）もでてくる。この場合、単純にプレーヤーを AI 化して負けないようにするだけでなく、敵や環境を、制御する AI に誤認識させる AI も研究されている。

　ペンシルバニア州立大学の Xinyu Xing 氏らのチームは DRL を利用してゲームに（異常に高い確率で）勝つ AI ボットを研究している。本稿は昨夏オンライン開催された Black Hat USA 2020 の講演の抄録だ。なお、本年の Black Hat USA 2021 はハイブリッド開催される。

●深層強化学習ゲームへの攻撃

　さて、DRL は、ゲームのようなモデル化された環境であるほど高い効果を発揮する。無敵のブロック崩しプレーヤーの研究、囲碁有段者でも勝てない AlphaGo・OpenGo、名うてのポーカープレーヤーの心理戦が通用しない Texas hold'em などは、どれも DRL で実装された AI ボットだ。StarCraft II や Dota 2 のようなリアルタイムシミュレーションゲームでも、敵キャラの動きなどに DRL が利用されている。

　一般的に DRL や機械学習（ ML ）への攻撃は、トレーニングフェーズの段階に汚染データを注入して学習を妨害する方法や、入力データに細工をしてニューラルネットワークの評価処理に摂動（相互作用）を引き起こさせる方法が知られている。後者のデータに施す細工は人間には知覚できないが、AI の処理には影響を及ぼす。たとえば、バナナ（に見える）の画像を自動車や別のものに認識させる手法だ。

関連記事