ぱぱぞー御殿

ハワイノマドを目論むITマンの雑多な情報まとめ

GoogleAnalyticsで検索エンジンのクローラーが訪れた回数を知るには?

対象:中級者,GAIQ受験者

今回もGAIQ対策に関する記事です。

GAIQではたまにGoogleAnalyticsに関する知識だけでは解く事が出来ない問題も出題されます。

このテーマもそのひとつかもしれませんね。

出題としては

クローラーロボットのトラッキングについて該当するものを答えなさい」

  1. 検索エンジンクローラーIPアドレスを持たないためGoogleAnalyticsではトラッキングすることが出来ない。
  2. 検索エンジンクローラーCookieを使用することが出来ないのでトラッキングすることが出来ない。
  3. 検索エンジンクローラーJavascriptを実行することが出来ないのでトラッキングすることが出来ない。

このような形で出題されます。

※もちろん本番では英語で出題されますが、、。

 

さて、前提として先に申し上げておく必要があるのは、

GoogleAnalyticsはGoogleやYahooなどの検索エンジンクローラー(検索ロボット)のアクセスをトラッキングすることはできません。

なぜトラッキングが出来ないのか?についての問題というわけですね。

答えは上記でいうと「3」です。

GoogleAnalyticsはJavascriptCookie(ファーストパーティー)という2つの技術を用いてサイトのデータをトラッキングしています。

(※ファーストパティーCoookie?という方は >>こちらの記事をどうぞ

検索エンジンJavascriptを実行することが出来ないのでGoogleAnalyticsは検索エンジンクローラーをトラッキングすることが出来ないわけです。

なぜGoogleAnalyticsではクローラーをトラッキングしないのか?

技術的にはトラッキングしないことはわかりましたがなぜそのような仕様にしたのか?
について少し考えてみます。
そもそもアクセス解析には大きくわけて2つの目的があります。

  1. サイトをユーザーにとってよりよいものにしサイトの収益効率等をアップする
  2. サイトインフラを常に最適なものにするためにサーバーの負荷を測る

1は皆さんが考えているものだと思いますが2は
え?そうなの?という方も多かったのではないかと思います。

アクセス解析は元々サーバーの負荷を測るものだった??

1990年代後半まではネットワークインフラ(サーバーなど)は非常に高価なものでした。

そのため企業としては自社にとって必要最低限のインフラしか用意したくないので、それを最適化するためにアクセス解析を行って、どのくらいのアクセスがあってどれだけサーバーに負荷がかかっているかを調べていたわけです。

※ちなみにこのようにインフラに対しての負荷を計測するために行う解析をい「ログ解析」と呼びます。

そして近年においては「よりよいサイトづくり」のためにアクセス解析が行われている。
というわけです。

サイトインフラへの負荷を計測するのが目的であればアクセスしているのが人であろうが検索エンジンクローラーであろうが関係なく計測する必要がありますよね、あくまで負荷の測定ですから。

しかし、GoogleAnalyticsのようにユーザー、ようは人にとって「よりよいサイト」をつくるために行うアクセス解析においてクローラーは解析の対象外なわけです。

事実、GoogleAnalyticsのもとになった「Urchin6」という解析ソフトではクローラーも計測が出来たそうです。
私はGoogleAnalyticsしか使った事がないので知りませんでしたが、サイトによってはかなりのアクセス数があるそうです。

こちらのサイトに記載がありました。>>ASCII.jp × WEB Professional

GAIQを攻略するためだけであれば、

Javascriptが原因でGoogleAnalyticsはクローラーを検知できない

という事だけ知っていればかまいませんが、せっかくですからその背景にある考え方についても知っておくとよりよいですね。

今日はここまでです。