Google Analyticsのアクセス解析で、リファラスパムアクセスを除外する方法【備忘録】

公開日:2020(令和2)年9月30日/最終更新日:

Google Analyticsのアクセス解析で、リファラスパムアクセスを除外する方法【備忘録】



今日はどれだけの人が見に来てくれたかな?と楽しみに?(苦しみかもしれない・・)で確認するアクセス解析ツールとして有名なGoogle Analytics。恐らくブログやホームページを公開されている方で使われていない方はいないでしょう。

なんてったってどれだけアクセスが増えてデータが膨大になってもタダで履歴を残してくれるし、Analyticsそのもののレポート画面は見にくくても、WordPressにはそれを簡易的に表示できるプラグインがたくさんリリースされていて、ダッシュボードから一発で概要の確認ができますから、大変便利だと思います。

でも・・・時折あるんですね。

「おっ今日は何だかたくさんのアクセスが!!」(喜)

というぬか喜び。よく見ると、なんだか「リファラ」というところの数字が異常に多い。リファラ元を見ると、なんだか見たことのないURL(ドメイン)からだけたくさん来てる。いったいどこのサイトなんだろう・・ってクリックしたり、URLコピーして開いたりしちゃ絶対ダメですよ!!

というのはこれ、いわゆる「釣り」だからです。リファラスパム行為と言って、先ほどのように「どこから来たのかな~~」でクリックされるのを狙った行為なんです。

ひとまず、「リファラ」だの「スパム」だのという言葉の意味については後回しにして、ひとまずGoogle Analyticsのレポートから迷惑なアクセス数を除外する方法を紹介しつつ、私もいつもこの設定を忘れがちなので、備忘録として残しておこうと思います。

ちなみに、この手のことを検索するとよく出てくるのが「撃退する方法」とか「防ぐ方法」といういかにも相手からの行為を遮断するというタイトルが出てくるのですが、どの情報もこの記事と同じく「表示されないようにする」ものであり、除外するという言葉が妥当なんだと思うんですけどどうなんでしょうね?

まあまあ小言は置いといて・・・と、早速手順をば

Google Analyticsのレポートからリファラスパムアクセスを除外する手順

私はWordPressというサイト作成ツールでサイトをいくつか運営しています。そしてアクセス解析にはGoogle Analyticsを使っていますが、GAinWP Google Analytics Integration for WordPressというプラグインを使ってダッシュボード上でアクセスレポートの確認をしていますから、Google Analyticsの管理画面(レポート画面)を見ることはほとんどありません。

そこで時折見つけるのが「リファラ」という項目に現れる、よくわからないサイトからのアクセス。それも尋常な数ではありません。これは基本無視しておけばいいのですが、できればレポートはちゃんとアクセスされたものだけを見たいので邪魔で仕方ないですから、以下のようにしてレポートに参入されないようにします。

Google Analyticsの管理画面を開き、「管理」の「すべてのフィルタ」を開きます

Google Analyticsのアクセス解析で、リファラスパムアクセスを除外する方法【備忘録】|Ordinary Life

「フィルタを追加」をクリックします

Google Analyticsのアクセス解析で、リファラスパムアクセスを除外する方法【備忘録】|Ordinary Life

以下の内容を入力します(この記事を書く際に設定したものをそのまま掲載しています)

Google Analyticsのアクセス解析で、リファラスパムアクセスを除外する方法【備忘録】|Ordinary Life

①フィルタ名・・・適当な名前をつけてください

②フィルタの種類・・・「カスタム」を選択してください

③フィルタフィールド・・・「参照」を選択してください

④フィルタパターン・・・リファラに載ってたドメイン(http(s)://のないURL)を入力してください

そして同じ画面下の項目で、適用するレポート(ビュー)を右側に追加します

Google Analyticsのアクセス解析で、リファラスパムアクセスを除外する方法【備忘録】|Ordinary Life

ここまで設定したら保存しておしまいです。

しばらくするとレポートから④経由で来たよ!っていうアクセスが除外されてアクセス数などが再計算されます。

※もう一回書きますが、実際にはスパム行為が止まっているわけではありません。が、リファラスパムの場合は実質止めることは不可能ですのでレポートに表示(参入)されなくするという「除外」措置をしているのです。理由は次項を参照ください。

「リファラ」「リファラスパム」って何??

リファラというのは正式名称を「HTTPリファラ」と言い、どういうものなのかはウィキペディアのページに詳しく書かれています。

・・・という感じで、上の「ウィキペディア」っていう青い文字をクリックすると、ウィキペディアのリファラに関するページが開かれますよね?これをリンクと言います。

この時、Google Analytics側では、単純にアクセス数に1を足すのと同時に今ご覧になっているページのリンクを経由してアクセスされましたよ!という形で記録します。これをサイト管理側がレポートとして見たとき「どのページからのリンクを経由してアクセスがあったか」を知ることができるようになっています。これはリンク元のページに書かれている内容を確認するためにも、リンク元サイトを発見するためにも役立ちます。

リファラスパムというのは、この仕組みを悪用して、リンクを張っていないページからあたかもアクセスがあったようにGoogle Analyticsに認識させる行為を言います(自身どうやってやるのかは知りません)。大抵の場合、レポートに表示されるドメイン(http(s)://のないURL)は実在しているのですが、そこにアクセスすると即座に別のサイトへ遷移(移動)させ、何かの契約を迫ったりします

ターゲットはサイトを持っててGoogle Analyticsを使っている管理者ですから、よくあるのはGoogle Analyticsと似た仕組みのアクセス解析ツールの紹介ページへ移動するパターンです。

要するにアクセス解析を有料で行う仕組みを紹介するための広告手段としてGoogle Analyticsの仕組みが悪用されているのです。

基本的に「何?」とアクセスしてみても何も起こりませんが、ひょっとするともっと悪質な場合が存在するかもしれないので、基本的には無視するか、ネットの検索窓へ前後に「’」をつけて検索すれば情報が拾えますから確認するといいでしょう。

そして何度も強調してますが、本当にそのサイトに張られたリンク経由でアクセスされた実態がないですし、プログラムでスパム行為をしてくるので、そのリンク経由でアクセスしたよ!という人自体がわからないですから、アクセス拒否できない=撃退や防止はできないということになるのです。

ざっと簡単に解説しましたが、「ふーーん」と納得いただければ幸いです。