ようやく Google Analytics が何であるかが分かった!

ようやく Google Analytics が何であるかが分かった!

 

Google Analyticsの研修を受けてみた 

今日は、自分なりに理解できた Google Analytics の原理についてお話しします。(というより、自分のための備忘録と言った方がよいかもしれません。)

このブログをどれだけの方に読んで頂けているか等を調べるために Google Analytics を入れてはいたのですが、今ひとつ使い方が分かりませんでした。

書籍も何冊かは買ったのですが、この手のモノにありがちな操作方法が延々と述べられているものばかりでした、何故その効果が得られるかという原理原則が書かれていないので辟易していた、というのが実情でした。

この状態から脱却するためには「習うより慣れろ」だ、とセミナーに出かけて手を動かすことにしました。参加したのは、先週の土曜日(12日)に開催された 初心者向けGoogle Analytics実践講座 | TechAcademy です。

このブログのベースにしているWordPressについても、同じシリーズの講座に出たら、本を読んでも分からなかったのが一発で分かりました。ということで、このシリーズは私としてはお勧めです。

なお、今回の講師の吉田喜彦さんは、Googleアナリティクス基礎講座という本を書いています。

講義は吉田さんが運営されているサイトの実際の訪問データを各自Google Analytics を操作しながら分析するというスタイルで進められ、その点が非常に良かったと思います。

Google Analytics って多次元データベースなんだ!

お蔭さまで Google Analytics の使い方が非常によくわかりました。しかし、私にとってそれ以上に収穫があったのは、吉田さんがそこまで明確には指摘しなかった2つの点でした。

一つ目は、吉田さんが講義の最初の方で言われた次のことです。

「Google Analyticsの画面はどれも2次元で共通したフォーマットになっている。縦軸がディメンション(次元)で、横軸が指標である。そして、重要なのはディメンション(次元)の方だ。」

この言葉がずっと気にかかっていたところ、講義の終わりの方で二つ目のコメントがありました。

「Google Analyticsというのは所詮データベースで、それをどう見せるかを工夫しているだけだ。データベースに入っていないものを見ようとしてもダメ。」

これでピンと来たのは、Google Analyticsは非常に変わった形をしているが、基本は多次元データベースなんだということでした。昔、Business Intelligenceのコンサルティング・グループの立ち上げを指揮したことがあったので、私にはこれさえ分かれば充分でした。

この世界に馴染みの無い方のために、多次元データベースとはどういうのもかを次の図を使って大雑把に(正確さは犠牲にして)説明しておきます。

Google Analytics

多次元データベースは、図の上段左側のような形をしています。中央にファクトと呼ばれるデータ(これは足し算ができる数値で無ければなりません)があり、周囲に分析の切り口となる次元と呼ばれるものがいくつかあります。(多次元データの名前が表すように、この次元の数はいくつあっても構いませんが、あまり多すぎると分析が難しくなるので、目的に応じて適切なものをいくつか選びます。)

教科書に良く出ている例が、上段真ん中の図のような販売データの分析用の多次元データベースです。これは、売上高を、顧客別、製品別、営業所別等の切り口で分析しようとするものです。

多次元データベースを使って有意義な分析をするためには、分析の切り口となる「次元」に分析用の「属性」を付ける必要があります。たとえば上段右側に示したような営業組織の階層構造は営業所の属性ですし、顧客についても、目的によって大企業、中小企業と言った企業規模や業種といった属性を付ける必要があるでしょう。

この例で、まず各営業所ごとにすべての顧客と製品の売上を足せば、営業所の総売上が出ます。これを階層構造に沿って足し上げていけば、静岡営業所の総売上、関東地区の総売上、全社の総売上、等が得られます。

多次元データベースとは、予め(実際には必要になった時にその場でやることも多々ありますが)このような属性別の様々な足し上げをしてあるものを指します。

そして全社の売上が足らない等の問題を分析したいときに、売上の足らないのは関東地区だろうか?、さらに静岡営業所だろうかと言う風に属性を分解していき、原因を究明することに使われます。(必要であれば、顧客を企業規模別に分解する等のことも行われます。)

非常に大雑把ですが、本稿の目的にはこの説明で充分だとしましょう。

多次元データベースと言う視点で Google Analytics を理解すると

さて、セミナーから帰った後いろいろな文献を調べたところ、 Google Analyticsは概ね図の下段のよう多次元データベースになっていることが分かりました。(Googleの情報収集の仕組には詳しくないので、考え落ちがあればご指摘ください。)

まず中央のファクトに当たるところには、セッションのデータがあります。これがGoogle Analyticsの様々な「指標」(訪問数、訪問別ページビュー、訪問時の平均滞在時間、等)のもととなります。

セッションとは、ユーザがAnalyticsの分析対象サイトに入ってきてから、いろいろなページを見た後出て行くまでの一連の動き(いつどのページに入り、いつ次のページに移ったかを束にしてまとめたもの)を指します。ページ毎の滞在時間は、そのページに入ってきた時刻と、次のページに入った時刻の差から計算されます。(サイト外の情報は取れないので、最後のページの滞在時間はゼロとならざるを得ず、サイト全体の平均滞在時間は短めに計算されてしまうそうです。)

次元の方はこのまま説明するとテクニカルに過ぎるので、どう使われるかの方から説明することにします。

まず、Google Analytics はユーザが外のどのページから分析対象サイトに来たかを把握しています。たとえば、Facebookから来たか、検索システムから来たか(分かる場合にはそのときに検索キーワードは何か)、等です。これを使ってFacebookへの投稿の有効性等を検討できる訳です。

これに使われるのがリファーラルです。インターネットのプロトコルがこの情報の収集を可能にしています。新たなページへのアクセスを要求するときには、今どのページにいるかの情報を提供することになっているのです。(詳しくは Referrerはなぜ取得できるのですか? – その他(インターネット接続) – 教えて!goo を参照ください。)

次に、サイト訪問者の男女別、年齢別等の統計を表示できるようになっていますが、それに使われる次元がブラウザです。正確に言うと、使用ブラウザのCookieです。

Googleは、ユーザがGoogleと提携してるサイト(AdWords広告ができる、100万を超える)にアクセスすると、ユーザのブラウザのCookieに訪問番号を記録し、この情報をもとにユーザの属性を推測します。Googleは提携サイトの情報を持っているので、婦人服のサイトにアクセスの多いユーザは女性だろうと見当をつける訳です。

この機能は、Googleのターゲット広告の価値を高めるために非常に重要なので、Googleは毎日毎日これを洗練させています。(これについての詳細は、特定の年齢や性別のユーザーを掲載対象にする – AdWords ヘルプ の「Google が属性情報を識別する方法」のところを参照ください。)因に、私は男性、年齢56-65歳と把握されていて、合っています。

最後に、最近はユーザがどの市町村にいるか等の情報も得ることができるようになっていますが、これにはIPアドレスを使います。これはIPアドレスの管理システムに登録された情報をもとに推測しているので、管理精度に依存します。(詳しくは、サイト訪問者はどこから来ている? 地域の精度はどれぐらい? 「地域」レポートを正しく活用しよう [第40回] (p.3) | Web担当者Forum を参照してください。)

世の中の解説書がHowの説明だけで、What, Why を語らないことは問題

一見不思議なGoogle Analiytics の分析機能のようなものも、その動作原理を理解すれば良く理解できるという事例の紹介でした。

ただ不満なのは、このような情報を一箇所にまとめたものが見つからないことです。解説サイトを調べると操作方法を書いてあるものばかりでうんざりします。Webの世界で良くあることですが、機能の羅列ではなく、その背後にある原理原則を皆で共有し合うと言う習慣が確立して欲しいものだと思います。

サブコンテンツ

このページの先頭へ