「未来を記録する」サイバーインテリジェンスサービス、Recorded Future サービス概要 | ScanNetSecurity
2025.02.28(金)

「未来を記録する」サイバーインテリジェンスサービス、Recorded Future サービス概要

Recorded Future は、80 万以上の情報ソースと 2,000 万のドキュメントから毎日 4,500 万件以上の新しい情報を処理する。過去 9 年間の蓄積データをベースに、独自の機械学習とエキスパートのルールモデルの組み合わせにより、将来起こるリスクを“予測”するという。

研修・セミナー・カンファレンス
PR
Recorded Future CTO スタファン・ツゥルヴェイ氏
  • Recorded Future CTO スタファン・ツゥルヴェイ氏
  • SNSやペースとサイトなどから情報を収集:規模は民間最大とも
  • リスクスコアや背景、予想されるインシデントはこのような「カード」としてまとめられる
  • 情報の収集から言語別仕分、分析、API連携による配信までの大きな流れ
  • とあるWebページが Recorded Future によって補足・収集・解析されていくプロセスの詳細
  • 収集された脅威情報は分解され「攻撃元」「標的」「攻撃方法」「キャンペーン名称」「関連情報」などのタグが付与される
 悪用された IPアドレスのデータベースや、Web サービスへの不正ログイン傾向、あるいはサイバー攻撃のアクターコミュニティの掲示板など、広くネット上の情報を収集・分析・評価し、自組織のセキュリティ対策や経営判断の材料となる知見を提供するサービスは、スレット・インテリジェンス・セキュリティ・サービス(TISS)と呼ばれ、近年日本でもさまざまなベンダの紹介が進んでいる。

 インテリジェンスサービスは、これまでの基本的に受け身だったセキュリティ対策を、先を予測した能動的な活動に変えるポテンシャルを持ち注目されているが、10月1日「Recorded Future(記録された未来)」という個性的社名のインテリジェンスサービス企業が、その日本法人であるレコーデッド・フューチャー・ジャパン株式会社を本格稼働させた。

 Recorded Future は、80 万以上の情報ソースと 2,000 万のドキュメントから毎日 4,500 万件以上の新しい情報を処理する、TISS に特化したセキュリティサービスプロバイダだ。過去 9 年間の蓄積データをベースに、独自の機械学習とエキスパートのルールモデルの組み合わせにより、将来起こるリスクを“予測”するという。

 10 月初旬に、セキュリティカンファレンス Security Day Fall 2018 のキーノートスピーカーとして来日した、同社共同創設者 CTO スタファン・ツゥルヴェイ氏に話を聞いた。


――お時間いただきありがとうございます。さっそくですが、ずいぶんと野心的な御社名の由来について教えてください。

ツゥルヴェイ氏(以下同):現在 Recorded Future 社の CEO を務めている、もうひとりの創設者であるクリストファーが Web の情報を分析する研究を行っていました。その頃私はある調査機関で、過去のデータを元にして、鉄道の電車がいつ故障するかを予測するアルゴリズムの研究をしており、私とクリストファーが専門分野を組み合わせれば、これから発生する事態を予測する事業をはじめられると思ったのです。社名はその思いをこめています。

――未来を知っているはずなのに、予測が外れたじゃないか、というような、社名が理由で何か言われたことはありますか?

 そうですね、とくにないと思います(笑)。サービス内容は利用規約でユーザーに充分理解いただいていますし、いわば天気予報と同じです。雨の確率が 80 % でも、傘を持つかどうかは本人の判断であるようにね。我々の予測はリスクスコアとして危険度を数値化しています。その数値をもとにユーザーは対策や行動の意思決定ができるのです。Recorded Future の最大の特長のひとつが、スコアなどの情報だけでなく、その数値の根拠となった理由や背景情報等、詳細なエビデンスを一緒に提示することです。たとえ 80 % でもエビデンスを参照すれば、自社にとって重要ではないと判断できることもあるでしょう。反対に、スコアが低くても、看過できない情報もあります。

――最近ではスレットインテリジェンスを提供するベンダー、プロバイダーが増えていますが、Recorded Future の差別化ポイントを教えてください。

 まず、民間企業最大といわれる調査対象の広さ、情報量です。オンライン情報を対象としており、新聞、ブログ、SNS、コードレポジトリ、ペーストサイト、各種フォーラム、ダークウェブの情報など、オンライン上のほとんどの情報を対象としています。情報ソースは 80 万以上とありますが、例えば Twitter の情報も 1 つとカウントした件数です。

 二つめは、セマンティック分析に力を入れている点です。社名やブランド名で調査を行う際に、キーワードだけではなく、それが言及された場所・時間・状況総体をひとつのイベントとしてとらえ、文脈を考慮してスコアリングしています。当然のことですが、同じ発言がなされても、Twitter なのか、ダークウェブなのかで意味は全く異なりますからね。

 三つめの、そして最大の特徴は、収集したデータの分析に機械学習を取り入れ、自動化とスピード化を進めているところです。企業でスレットインテリジェンスサービスを選定するときに、自社関連情報をトライアルで分析してもらうことがありますが、パイロットレポートがでるまでには長い場合は数週間かかることもあります。Recorded Future は 80 万のソースの情報を、9年前から現在までリアルタイムで収集分析していますので、社名なり IP アドレスを指定してもらえれば、すぐにトライアルレポートを出すことができます。

――スレットインテリジェンスサービスにおける Google のような情報量・処理量ですね。

 Google はすべての情報をインデックスしようとしていますが、我々は、スレットインテリジェンスに特化した情報をタグづけしています。解析の流れは、まず情報ソースからテキストを抽出し、ログなのかコードなのか、言語はなにか、トピックはなにかをタグ付けします。次に、マルウェアや社名などのキーワードを調べ、どんな文脈で出現しているか、どのようなイベントなのか(攻撃行動か事前調査か)を特定し、最後に日付と時刻の分析を行いリスクスコアを算出します。このシーケンスのほとんどが機械学習で自動化されていますが、イベントの抽出、日付の分析、リスクスコアリングはルールベース(アルゴリズム)で行っています。

――オンラインの文字以外の情報を集めるために、Recorded Future は SOC のような仕組を持っていますか。

 集めた情報を専門的視点から差配するアナリストが 20 名ほどいますが、SOC はありません。実は世界の SOC 事業者さんは我々の顧客なんです。Verizon など多くの大手キャリア、SOC、MSS 事業者さんにご契約いただいています。

―― Recorded Future の公式サイトでは、国内でもすでに数社が顧客になっているようで、日本での展開が楽しみですね。

 現在、急ピッチで日本語の文字体系への対応を進めているところです。

――是非、「日本の未来」を記録して、サイバー空間の安全を高めて下さい。ありがとうございました。
《中尾 真二( Shinji Nakao )》

関連記事

「経理」「営業」「企画」「プログラミング」「デザイン」と並ぶ、事業で成功するためのビジネスセンスが「セキュリティ」
「経理」「営業」「企画」「プログラミング」「デザイン」と並ぶ、事業で成功するためのビジネスセンスが「セキュリティ」

ページ右上「ユーザー登録」から会員登録すれば会員限定記事を閲覧できます。毎週月曜の朝、先週一週間のセキュリティ動向を総括しふりかえるメルマガをお届け。(写真:ScanNetSecurity 永世名誉編集長 りく)

×