リファラースパムを弾け!Google Analyticsでフィルターを設定する方法
2015/10/11
Google Analyticsでどこから見に来てくれてるのかなと思って参照先を見て、気になったものがあれば覗きに行ったりしてます。
個人サイト的なドメインだと、大体は関連する内容の記事で参考にしましたとリンクしてくれてることが多いです。
それ以外のドメインで、「floating-share-buttons.com」とか「www.event-tracking.com」みたいな「何かのサービスを提供してますよ」的な名前のものが結構あったりします。
これも気になって確認するのですが、全くリンクとか張られて無さそうなサイトに行き着きます。ここにあるSNSボタンとか、解析ツールを利用すると、リファラーがこのサイトのものになるのかな?とか思って気にしないようにしてました。
そして、先日Google Analyticsでイベントトラッキングを導入した時に、これらがリファラーを用いたスパムであるということを知りました。
【Google Analytics】広告や外部リンクのクリックされた情報を解析!【イベントトラッキング】
まだイベントを登録していないのに「to use this feature visit: EVENT-TRACKING.COM」というイベントが既に何件か存在していて、調べるとスパムだということ。
Analyticsに現れるスパムなURL達に関して
ついにイベントトラッキングにまでスパムの魔の手が
参考にしたサイトのフィルタのかけ方がビュー単体に対してだったり、ホワイトリスト方式だったりするので、自分の欲しいのとちょっと違いました。
というわけで、Google Analyticsのアカウント全体に、ブラックリスト方式でスパムを弾くフィルターの設定方法です。
スポンサーリンク
Google Analyticsのフィルター設定方法
Google Analyticsの画面上部ある「アナリティクス設定」をクリックすると、左側のアカウント内に「すべてのフィルタ」、右側のビュー内に「フィルタ」があります。
1つのサイトの中で、ある条件に対してフィルタをしたいという場合は、ビュー内の「フィルタ」を設定すると良いと思いますが、今回の様なスパムの対処はアカウント全体から一括で行いたいですよね?
もし個別にフィルタをかけたいなら、ビュー内の「フィルタ」を選択して下さい。設定するフィルタの内容はどちらでも同じです。
スパム除外のフィルタ設定例
これが正解というのはないですが、スパムドメインの数だけ作成するのは大変なので、正規表現で除外フィルタをかけます。
- フィルタ名:自分が分かれば何でもいいです。
- フィルタの種類:正規表現を使うのでカスタムを選択します。
- フィルタフィールド:キャンペーンのソースを選択します。
- フィルタのパターン:除外したいドメインを正規表現で入力します。
フィルタフィールドで「キャンペーンのソース」を選択しているのは、これが1番補足してくれるらしいからです。
理由を書いている人が見つからなかったので、公式を確認しましたが、何故これが良いのかよく分かりません。とりあえず右にならえで(´・ω・`)
カスタム フィルタのフィールド – アナリティクス ヘルプ
フィルタのパターンの正規表現はすぐ近くにGoogle先生がリンク置いてくれているのでそれを確認してみましょう。
正規表現の概要 – アナリティクス ヘルプ
私が入力したのは、テスト用に2つだけ指定したものです。
www\.event-tracking\.com|floating-share-buttons\.com
「|(パイプ)」で複数指定していて、「.(ドット)」は任意の1文字という特殊文字なのでエスケープしてます。
後は、「ビューにフィルタを適用」で、全て「選択したビュー」に「追加」して「保存」で完了です。
アカウントにある「すべてのフィルタ」は一元管理するのにとても便利です。
フィルタの設定がうまく出来てるか確認
設定した内容が正しいかどうか分からないので、しばらくしてから消えてるかどうか確認しておきましょう。
7日にオレンジと、紫のものだけ設定したので、日が浅く効果あるのか分からないと思いますが、設定したものは以降カウントされなくなります。
うーん…。分かりづらいので、今表示されているスパム全部指定して「いなくなった!」ということが分かるようにしよう(;´∀`)
スパムかどうかの確認
今までリファラーにスパムが潜んでいるとは思っていなかったので、そのまますぐにアクセスしてしまっていました。
しかし、スパムが潜んでいる以上、危ないサイトに誘導されているかもしれないので、直接アクセスするのは危険です。
そこで、自分の代わりに危険なサイトかどうかの確認をしてくれるサービスがありました。
ここに怪しいサイトのURLかドメインを貼り付けて「調べる」をクリックすると、画面のキャプチャ、マルウェアの有無、whois情報など色々教えてくれます。
応答に結構時間がかかります。何故か当サイトのURLで試してみましたが「画面構成中…」のまま終わらない(´・ω・`)
スパムっぽいドメインは比較的早く表示されるので、本来の目的には支障なく使えます。
なんか怪しそうだけど気になる!という時は、aguse等のサービスを利用するようにしましょう。
スパムドメインの見分け方
確実ではないですが、ある程度のアクセス数があれば、以下の2点が一致したらスパムである確率が高いです。
- 新規セッション率 100%
- 平均セッション時間 0秒
私のサイトに来たスパム一覧
2015/7/26~10/10までで、アクセス多い順
floating-share-buttons.com
get-free-social-traffic.com
www.event-tracking.com
site3.free-floating-buttons.com
qualitymarketzone.com
site7.free-floating-buttons.com
www.Get-Free-Traffic-Now.com
site2.free-floating-buttons.com
site4.free-floating-buttons.com
site6.free-floating-buttons.com
chinese-amezon.com
free-social-buttons.com
rednise.com
site1.free-floating-buttons.com
site5.free-floating-buttons.com
site10.free-floating-buttons.com
8番だけ来てなかった(´・ω・`)コレクター泣かせやわ
「site8.free-floating-buttons.com」
こいつらを撲滅する正規表現コード
floating-share-buttons\.com|get-free-social-traffic\.com|event-tracking\.com|free-floating-buttons\.com|qualitymarketzone\.com|Get-Free-Traffic-Now\.com|chinese-amezon\.com|free-social-buttons\.com|rednise\.com
終わりに
まさかスパムがリファラーに潜んでるとは思ってませんでした。
迷惑メールのフィルタみたいに、これはスパムですって報告したら集計されなくなるような仕組みが欲しいですね。
今はそんな数が多いわけではないので、気になるものだけフィルターに追加する対応で何とかなりそうですが、多くなると厄介です。
今回はスパムの除外フィルターの説明をしましたが、フィルターをうまく使えば目的の情報をパパっと確認出来る様になるので、是非活用してみて下さい。
それでは。