ロングテールと物理的制約

4ヶ月ぶりに東京に戻って自社サイトのアクセスログをちょっと分析してみたら、なかなかおもしろい結果をみることができました。
見事にパレートの法則(あるいは80:20の法則、パレート自身は一度もこの「80:20の法則」という表現を使っていません)の傾向を示すデータが見られたんです。

アクセスログ解析に見られたパレートの法則

調べてみたのは、
  • ページ単位でのページビュー数
  • 検索エンジン経由での訪問時のキーフレーズ
の2つ。
そのいずれもが、上位20%が全体の約80%を占めるという80:20の法則を示していました。
さらに今度は上位20%だけを対象にして、そのうちの上位20%(全体の4%)が全体の20%の何%を占めているかを調べてみると、ここでも同じように上位20%(全体の4%)が全体の20%のうちの80%を占めるという入れ子状の傾向を見せていました。

キーフレーズに関しては、約4万近い組み合わせのフレーズのうち、3万弱くらいが1回しか使われていないキーワードの組み合わせによる訪問でした。
きっとグラフで見たら、間違いなくロングテールだと見ることができるでしょう。
きっと皆さんの会社のWebサイトやブログなどの数値も同じような傾向を示しているのではないかと思います。興味を持った方はぜひ一度調べてみてはどうかと思います。

曖昧なロングテールの定義

そもそも、僕にはロングテールの法則の定義がよくわかっていません(むしろ、きちんと定義できていないのではないか?と思っています)。
80:20の法則に反するものをロングテールと呼ぶのか? グラフ化した際にヘッドに対して長いテールを持つものをそう呼ぶのか?
前者であれば、今回調査した自社のサイトのデータはロングテールに当てはまらないし、後者であれば、それに当てはまります。
いずれにしても、それを法則と呼ぶにはちょっと無理があるなとは思っています。
ロングテール現象はパレートの法則とまったく対立しない」で書きましたが、僕はロングテール現象というのは単にパレートの法則のことだと思っていて、ベキ分布における8:2なりの数字が7:3なり、6:4という形に変化しているだけのことだと考えています。
つまり、数学的はそれは同じだということです。

スケールフリー・ネットワークとべき乗則

そうした定義の話は一度置いておいたとして、xのn乗という形で累乗の増加
(あるいは減少傾向)をみせるロングテールなりパレートの法則(誤解してはいけないのは、それらはnのx乗であらわされる指数関数的増加ではないということだ)が、話題になる際のポイントを見誤ってはいけないなと、あらためて数字を眺めてみて思いました。
基本的にはスケールフリー・ネットワークがみられるところでは、パレートの法則を示す傾向がみられます。ベキ分布が見られるのです。

スケールフリー・ネットワークという言葉を生み出したアルバート=ラズロ・バラバシは著書『新ネットワーク思考―世界のしくみを読み解く』の中で、ネットワークに秩序をもたらすスケールフリー・ネットワークとベキ分布の関係について、こんな興味深いことを書いています。

ベキ法則は、カオスが去って秩序が到来することを告げる明らかな徴なのだ。相転移の理論は声高らかに告げていた-無秩序から秩序への道は、自己組織化という強大な力によって切り開かれることを、そして、その道はベキ法則によって舗装されていることを。ベキ法則は、系の振るまいを特徴づけるさまざまな方法のひとつなどではなかった。それは複雑な系が自己組織化するときに見せるはっきりとした徴だったのである。

また、すでにこのブログでは何度か引用させてもらっていますが、公文俊平氏が『情報社会学序説―ラストモダンの時代を生きる』の中で記したこんな言葉もあります。
この宇宙の中では、ベキ分布(あるいは、ベキ乗の裾野をもつ分布)こそが、最も普遍的な分布であって、分布の中にもっぱら正規分布ばかりを見て取ろうとする傾向は、近代的平等主義者ないしリベラリストの知的バイアスだとさえいえるのかもしれない。
公文俊平『情報社会学序説―ラストモダンの時代を生きる』

リソースの確保にそれほど困難のない宇宙、世界、インターネットの規模で考えた場合、秩序のあるスケールフリー・ネットワークではべき乗則はむしろなくてはならないものだということです。

ロングテールと物理的制約

一般的にも言われているように、ロングテールはそれまで物理的制約条件(あるいはコスト的制約条件)によって十分なリソースの確保ができず、仕方なく切っていた尻尾を、インターネット利用というリソース面での革新がもたさられた中で、GoogleやAmazonのような一部の企業がそれをうまく活用する方法を発見したからこそ注目を集めました。
しかし、間違えてはいけないのは、インターネット利用=ロングテールではないということです。最初に見たように私の所属する会社のアクセスログ解析による数値は見事に80:20の法則と呼ばれる傾向を示していました。おそらく、多くのWebサイトで同じ傾向が見られるものと思います。これはひとえに多くのWebサイトがいまだ物理的制約(あるいはコスト的制約)にとらわれているからだと思います。

確かにインターネットを利用することで、情報リソースの在庫の問題は簡単に改善できるようになりました。しかし、リソースの確保の問題は単に在庫の問題であるだけでなく、リソースそのものの生産効率の問題でもあるはずです。
先日来、Employee Generated Media(従業員による情報生産~発信の仕組み)などと声高く言わせてもらっているのは、自社ではすでにその仕組みが数年前からできていてそれ相応の効果を発揮しているからです。自社内の情報生産リソースをうまく活用して、毎週のコラムの他に、代表を含めた従業員によるブログが6つ、さらにはVideocastも隔週ぐらいの頻度で更新していたりします。200名弱の企業ですから、それなりに情報生産性は高いのではないかと思っています。

ロングテール戦略には情報生産性UPのための特別な戦術が必要

しかし、それだけの情報生産性をもってしても、80:20の法則からは逃れられないということです。パレートの法則を示す数式をみれば、これは当然といえば当然で、どんなに生産性が高いといってもこの生産方式はxのn乗といった関数で示せるレベルには到底達していないからです。
おそらく、ロングテールを戦略的に目指すのであれば、Employee Generated Mediaによって自社内の情報生産性を高めるだけでは不十分なのでしょう。EGMに加え、CGMによる情報生産性をいかに取り込み、さらにインターネット上での情報生産性を高めるかを考えなくては、いくらインターネットがリソースの確保において優位性をもっているといっても、ロングテール戦略の実現は不可能なのだと思います。

実際、GoogleやAmazonといった先例がまさに戦略のうちに、CGMをはじめとする外部情報リソースの恩恵をうまく活用しているのを見ることができます。Adsenseやアフィリエイトというサービスの中に。

インターネット=ロングテールではないのです。
そして、ロングテール≠パレートの法則ではないのです。
そのあたりは単なる流行に流されず、きちんとその本質をとらえ、マーケティング戦略を考え直していかなくてはならないと感じます。

P.S.
当エントリーは、池田信夫Blogの好エントリー「ロングテールの虚妄?」のコメント欄になぜかリンクされてたので、その補足の意味もかねて。

関連エントリー

 

この記事へのコメント

この記事へのトラックバック

  • ロングテールと物理的制約
  • Excerpt:  DESIGN IT! w-LOVE に この記事 がありました。 アクセスログ解析に見られたパレートの法則調べてみたのは、ページ単位でのページビュー数検索エンジン経由での訪問時のキーフレーズ..
  • Weblog: ブログ将門
  • Tracked: 2006-08-13 21:56