個人で簡単に開設できるブログは、2008年3月末現在、国内で約1,985万サイトが公開され多くの人が利用しているが、近年はスパムブログの増加が問題となりつつある。スパムブログが増加すると、ブログのメディアとしての価値が弱まり、ひいては媒体全体が劣化する恐れもある。 そこでSCAN編集部は、スパムブログに詳しいデータセクション株式会社 社長 池上氏に、スパムブログの現状について話を聞いた。なお、データセクション社は2008年7月末に、スパムブログのURLをリスト化しデータ提供を行うサービスを開始すると発表した。●ブログ市場の過去・現在SCAN: ブログがどのようにユーザー数を増やしながら発展してきたかについて教えて下さい。池上(以下敬称略): ブログという言葉が、ネット業界で広く知られるようになったのは2003年からです。この時期に、現在も一般ユーザーによく知られるlivedoor blogやはてなダイアリー、ココログなどのサービスが開始されました。 総務省情報通信政策研究所の調べによると、国内ブログ総数は2004年から2005年にかけて急増し、近年においても増加傾向が続いています。2005年前半に500万、2006年1月に1,000万、2007年前半には1,500万を超えました。2008年1月現在、約1,690万のブログが公開され、このうち、1ヶ月に1回以上記事が更新されるアクティブなブログの数は約300万、ブログ総数の約2割弱に相当します。また、2006年時点での世界における日本語ブログの割合は、英語を抜いて37%を占めています。 また、株式会社矢野経済研究所の調査では、ブログサイト数は、2006年3月末で868万サイト、2007年3月末で1,395万サイト、2008年3月末で1,985万サイトと推計しています。そしてブログの市場規模は、2005年度11億円、2006年度27億4,000万円、2007年度46億3,000万円と拡大傾向で推移し、更に2008年度は63億5,000万円、2009年度は79億5,000万円、2010年度は91億5,000万円と引き続き拡大傾向にあると予測しています。総務省情報通信政策研究所(IICP)調査研究部「ブログの実態に関する調査研究の結果」 http://www.soumu.go.jp/iicp/chousakenkyu/data/research/survey/telecom/2008/2008-1-02-2.pdf 株式会社矢野経済研究所「ブログサービス市場の動向に関する調査結果 2008」 http://www.yano.co.jp/press/pdf/372.pdf 表1.国内ブログサイト開設総数の推移(矢野経済研究所調査より作成)◆2006年3月末 …… 868万サイト ◆2007年3月末 …… 1,395万サイト ◆2008年3月末 …… 1,985万サイト 表2.国内ブログ市場規模の推移(矢野経済研究所調査より作成)◆2005年度 …… 11億円 ◆2006年度 …… 27億4,000万円 ◆2007年度 …… 46億3,000万円 ◆2008年度 …… 63億5,000万円(予測) ◆2009年度 …… 79億5,000万円(予測) ◆2010年度 …… 91億5,000万円(予測) ●スパムブログの現状についてSCAN: どのようにスパムブログを定義、分類しているのですか?池上: 弊社では、スパムブログを次の通り定義しています。1.アフィリエイト・SEO目的のブログ・コピペ型:他のブログやニュースなどを自動的に貼り付けて文章を作成したもの・アフィリエイト系:特に内容はなく、商品の画像・リンクを大量に貼り付け、アフィリエイト収入を目的とするもの・ワードサラダ:文章の意味が通じない、キーワードを含む文章が組み合わせてあるだけのもの2.アダルト・出会い系サイトへの誘導目的のブログSCAN: スパムブログがブログ全体の40%を占めるとニフティが発表しましたが?池上: 総務省情報通信政策研究所の調べによると、2008年1月現在では、アクティブブログの12%がスパムブログに該当し、その内訳は、販売誘導系のものが38.3%、アフィリエイト収入目的のものが17.1%、アダルト・出会い系のものが7.0%となっています。2008年3月発表のニフティの調査では、国内ブログの4割はスパムブログであるとなっていますが、これはブログ単位ではなくページ単位で計測した結果だと思います。表3.ブログ全体におけるスパムブログの比率◆ブログ単位 …… 12%◆ページ単位 …… 40%ニフティ、スパムブログのフィルタリング技術を開発〜スパムブログについての自主調査を実施〜 http://www.nifty.co.jp/cs/07shimo/detail/080326003337/1.htm SCAN: スパムブログの問題点は何でしょうか?池上: ユーザーが知りたい情報に、なかなかたどり着けなくなってしまうことが挙げられます。例えば大手検索エンジン事業社のブログ検索で、女性アイドルの名前を入れて新着順で検索してみます。すると、スパムブログが多く表示されます。ブログの面白さの一つに即時性というのがあると思いますが、これではブログの良さが阻害されてしまいます。このままでは、ブログへの信頼性が低下し、ユーザー数が減少してしまう可能性があります。 またマーケティングの分野でも、スパムブログがノイズとなり、ブログ全体の正確な分析が困難になり、誤った分析・マーケティングが行われる可能性があります。現在はTVCMも、ただ単純に番組の視聴率だけでその効果を測るのではなく、その後、どのくらいブログで取り上げられたかを測っています。そこにスパムブログがノイズとして存在すると、TVCMの効果測定を正しく行うことが困難となります。 それらによって、ブログのメディアとしての価値の低下が懸念されます。SCAN: 事業者によってスパムブログの傾向の違いはあるのでしょうか?池上: ブログ事業者の提供するサービスの違いによって、よりサービスが充実している事業者にスパムブログが集中するといったことはありません。スパムブログ数は、事業者がきちんと規制するかに依存するところが大きいようで、規制の緩い特定の事業者に集中している傾向もあります。SCAN: 日本語で書かれたブログが世界一多いとのことですが、スパムブログは日本独自のものでしょうか?池上: 2005年、米Googleの提供するブログサービスBloggerとBlogSpotに対し、自動化ツールによる大量のスパム行為が行われました。これは、特定サイトの検索エンジンのランクを上に上げるのが目的でした。この事件が日本にも用いられ、スパムブログになったと言われています。SCAN: スパムブログはどうやって運営されているのでしょうか?池上: 現在、スパムブログを生成するためのツールが1〜2万円程度で売られています。この価格は以前の10分の1以下に値下がりしており、スパムブログがより一般的になってきたと言えます。またASPによるスパムブログ作成も行われています。スパムブログを運営する人はこれらを利用しています。SCAN: ここ最近のスパムブログの傾向について教えて下さい。池上: 最近は、他のサイトの文章を貼り付けただけのコピペ型よりも、ワードサラダ型が増加傾向にあります。恐らく、ワードサラダのツールが2007年夏辺りから出始めた為、急増したと思われます。ワードサラダは、サイト検索エンジンのスパムフィルタにかかりにくく、スパムブログがより高度化してると言えます。●スパムブログの収集方法とはSCAN: データセクション社では、どのようにスパムブログを収集していますか?池上: 弊社では、国内のブログを収集し、それを弊社で定義したルールでフィルタリングします。 対象となるブログ数は600万(約6億記事)に及び、毎日約100万ブログをクローリングしています。 それらの収集したブログを弊社独自のルール、例えば… 【執筆:編集部】【関連リンク】データセクション株式会社 http://www.datasection.co.jp/ スパムブログURLリスト提供サービス http://www.datasection.co.jp/service/service004.html 【資料一覧】総務省情報通信政策研究所(IICP)調査研究部「ブログの実態に関する調査研究の結果」 http://www.soumu.go.jp/iicp/chousakenkyu/data/research/survey/telecom/2008/2008-1-02-2.pdf ニフティ、スパムブログのフィルタリング技術を開発〜スパムブログについての自主調査を実施〜 http://www.nifty.co.jp/cs/07shimo/detail/080326003337/1.htm 株式会社矢野経済研究所 ブログサービス市場の動向に関する調査結果 2008 http://www.yano.co.jp/press/pdf/372.pdf 株式会社矢野経済研究所 クチコミブログ広告市場に関する調査 2008 年版 http://www.yano.co.jp/press/pdf/335.pdf ── ※ この記事は Scan購読会員向け記事をダイジェスト掲載しました 購読会員登録案内 http://www.ns-research.jp/cgi-bin/ct/p.cgi?w02_ssw