第2回 データベースとウェブフィルタリング | ScanNetSecurity
2024.04.24(水)

第2回 データベースとウェブフィルタリング

〜Websense Enterprise ver. 5.1〜

特集 特集
〜Websense Enterprise ver. 5.1〜

 有害なウェブサイトや仕事に無関係なウェブサイトへのアクセスをブロックするソリューションとして始まったウェブフィルタリングは当初は該当すると考えられるKeywordを集めてD/B化し、アクセスしようとするサイトのページにそのKeywordが入っていた場合、そのページへのアクセスをブロックするという非常に単純なソリューションとして始まりました。つまり、俗にブラックリスト方式と呼ばれるもので「このサイトへのアクセスはお勧めでできない」ということをフィルタリングソリューションを提供する会社が事実上決めていたわけです。

 学校、会社、さまざまな業種、さまざまな職種が存在する世の中で、このような単純なソリューションが長続きするわけもなく、今では姿を消してしまいました。市場が求めていた解決策とは膨大な数のウェブサイトがカテゴリに分けられて、D/B化されていて、簡単な設定で企業や組織のポリシーにあったアクセス、非アクセスの設定ができることでありました。また、同じ組織内でも職種・部署の違いの反映、時間帯による柔軟性などが求められました。

 なぜなら、ウェブフィルタリングソリューションは本来組織・企業の経営者(運営者)とそこで働く従業員(職員)がインターネットの利用を促進するソリューションであるわけです。インターネットの利用をその運営者のポリシーにそって利用する限り、そこで働く人があたかもフィルタリングソリューションが導入されていることに気づかない。それこそが正に理想的な姿であるわけです。

■データベースがなぜ重要か? 量と質のバランス

1 )データベースの量
 既にフィルタリングの基礎となるURLのデータベースの重要性は明らかであるとお感じでしょう。
 常に増え続けるウェブサイト、そのサイト数は膨大な量になります。つまり、量的に存在するウェブサイトをできるだけ多く網羅していることは精度の高いデータベースの前提条件として必要になります。ウェブセンスでは1994年の事業開始時より約10年の蓄積があり、現在全世界で11億ページに及ぶウェブページをD/B化しており、その約10%を日本語のサイトで占めています。

2 )データベースの質
 データベースの質には2つの側面があります。一つはカテゴリ分けの精度、もう一つはアップデートの頻度、精度によるものです。幾らデータ(ウェブサイトのページ数)が多くてもそれらが正確にカテゴリ分けされていなければフィルタリングの本来の目的を達することはできません。カテゴリ例では、ITの大枠カテゴリーの中にポータル・サーチエンジンサイトの小枠カテゴリが存在する区分分けを行っています。
 ウェブセンスでは特許取得のAI(人工知能)ロボットと有資格インターネット・アナリストによる目視の2つの方法でカテゴリ分けを行い、カテゴリ数も80以上に及んでいます。(詳細は下記マスター・データベースの構造を参照)
 また、ウェブセンスではアップデートに関しては7時間おきに上記2つの方法で常にサイトマイニングとカテゴリ分けを行い常に増加するウェブサイトの捕捉とリンク切れなどのサイトの削除を行います。また、WebCatcher(TM)(ウェブ・キャッチャー)機能(詳細は下記マスター・データベースの構造を参照)を用いることで、よりアクセスされる頻度の高いウェブサイトの検出・データベースへの反映も実施しています。


■マスター・データベースの構造

 このようにウェブフィルタリングにおいて重要な役割を担うデータベース、ウェブセンス社のウェブセンスマスターデータベースは下記のように3つの方法で構築・運営・維持されています。

1 )AI(人工知能)ロボットによるサイトマイニング
 特許取得のAI(人工知能)ロボットがウェブセンス独自のアルゴリズムに従って、WWW内のサイトをマイニングし大量のホームページをウェブセンス独自の80以上のカテゴリに分類します。このマイニングでは、実際にホームページにアクセスし、そのサイト内の言葉、画像などを認識しカテゴリ分けを自動的に行います。このマイニングを毎日繰り返し、前日との比較で増えている部分だけを常にアップデートしてゆきます。リンク切れや廃止になっているホームページについても同時に検出し、データベースに反映させます。


 ==================================================================
   ここまでで、ウェブセンスエンタープライズに興味をもたれた方
 ==================================================================
 ⇒ウェブセンスエンタープライズVer.5.1の詳細は?
  http://www.websense.co.jp/products/
 ⇒ウェブセンスエンタープライズVer.5.1を今すぐ評価するには?
  詳しくは下記30日間無料体験版(機能制限なし)ダウンロードサイトへ
  http://www.websense.com/downloads/?Lang=Japanese
  尚、ダウンロードされる際、「Websenseをご利用になる形態の選択」で「スタンドアロンサーバー」を選択頂くと、ご自分のデスクトップで手軽にGUI、設定方法などをお試しいただけます。
 ==================================================================
    もっとウェブセンスエンタープライズをお知りになりたい方
 ==================================================================
 ⇒次週は第三回「プロトコルマネジメントによるネットワークの制御」と題してHTTPプロトコル以外のプロトコルのマネジメントによるネットワークの管理・制御についてお話を進めます。

  ウェブセンス・ジャパン株式会社
  プロダクトマーケティング       小林敏知
  チーフ・セールスエンジニア      住澤大介

  ウェブセンスホームページ http://www.websense.co.jp
  お問い合わせは mailto:japan@websense.com

(詳しくはScan本誌をご覧ください)
http://www.vagabond.co.jp/cgi-bin/ct/p.cgi?m-sc_netsec
《ScanNetSecurity》

Scan PREMIUM 会員限定記事

もっと見る

Scan PREMIUM 会員限定記事特集をもっと見る

カテゴリ別新着記事

「経理」「営業」「企画」「プログラミング」「デザイン」と並ぶ、事業で成功するためのビジネスセンスが「セキュリティ」
「経理」「営業」「企画」「プログラミング」「デザイン」と並ぶ、事業で成功するためのビジネスセンスが「セキュリティ」

ページ右上「ユーザー登録」から会員登録すれば会員限定記事を閲覧できます。毎週月曜の朝、先週一週間のセキュリティ動向を総括しふりかえるメルマガをお届け。(写真:ScanNetSecurity 名誉編集長 りく)

×