Tweet about this on TwitterShare on FacebookShare on Google+

お問い合わせ

会社名任意
ご担当者様氏名必須
メールアドレス必須
お問合せ内容必須

個人情報保護方針

BLOG

Piwikのアクセスログ解析機能を利用してみる

piwik_logo

先日の記事ではPiwikの機能について触れました。
Google Analyticsではセキュリティや個人情報保護の観点から一部の機能が利用できませんが、
Piwikを利用する事でユーザー単位でのアクセストラッキングを確認する事ができます。
この他、できるだけ社外に情報は持ちだしたくない企業様にも最適のソリューションかと思います。

さて、今回はPiwikのもう一つの機能であるログ解析機能(server log analytics)について触れてみます。

 

■ server log analyticsとは?
PiwikにGoogle Analyticsと同等の機能がある事は前回の記事で触れましたが、
ログ解析機能はサイトに専用のタグを貼る事で初めて利用できるようになるため、
それより前の過去ログはPiwikに反映する事ができません。
そこで、サーバーのログを読み取り過去ログに反映する事を実現するのがserver log analyticsです。

ウェブサーバーとしてよく使われるApacheでは、/var/log/httpd内にアクセスログが保存されていますが、
これをPiwikが読み込んでログ解析を行う事でダッシュボードに情報を反映する事ができます。
しかしながらアクセスログに書かれている機能しか反映できませんので、
リアルタイム表示の場合と比べて、機能には若干ながら差が発生します。

機能差については以下の表にまとめましたので参考にしてください。

種類 Piwik(トラッキングタグ) Piwik(server log analytics)
解析手法 JavaScriptタグを読み込み解析 アクセスログを読み込み解析
過去ログの解析 ×
リアルタイム解析 ×
ユーザ別トラッキング機能 時系列・IPアドレス・端末種類・解像度・リンク遷移 時系列・IPアドレス・リンク遷移

前置きはここまでにして、Piwikのlog analytics機能を利用してみましょう。

利用するためには、Piwikが導入済みのサーバーはもちろんですが、
log analyticsを実行するサーバーにPythonの2.6以上がインストールされている必要があります。
CentOS/RHELでは最新のバージョン6であれば問題ありません。
尚、log analyticsを実行するサーバーとPiwikが導入されているサーバーは別々でも利用できます。

 

■ server log analyticsの利用
ログ解析を行うサーバーへPiwikをダウンロードしますが、インストールまでは行いません。
ソースに含まれているファイルを利用するだけです。

・Piwikのダウンロード&解凍

・ソースのダウンロード
wget http://builds.piwik.org/latest.zip
※ダウンロード・解凍はウェブ公開ディレクトリでなくてもOKです。

・ファイルの解凍
unzip latest.zip
(中略)
  inflating: piwik/piwik.js          
   creating: piwik/tests/
  inflating: piwik/tests/README.md   
  inflating: How to install Piwik.html

・piwik/misc/log-analyticsへ移動
cd piwik/misc/log-analytics

・log analyticsの実行
作業ディレクトリへ移動したらlog analyticsを実行します。
よく使われるパラメーターにつきましては説明を書きましたが、他にも様々なオプションがあります。
詳しくはマニュアルやソースを参照してください。

・log analyticsの実行
python ./import_logs.py --url=http://piwik.example.com/ /var/log/httpd/access_log.1 --idsite 1 --enable-static --enable-http-errors --enable-http-redirects --enable-bots --token-auth=********************

 --url piwikのURLを指定します。
 /var/log/httpd/access_log.1 読み込むアクセスログです。
 --idsite piwikで指定するIDを設定します。
 --enable-static cssやjs等のウェブページを構成する要素も含める場合に付けます。
 --enable-http-errors 404エラーも記載する場合に付けます。
 --enable-http-redirects 302リダイレクトも記載する場合に付けます。
 --enable-bots クローラーからのアクセスも記載する場合に付けます。
 --token-auth 数字と英文字の羅列からなるパスワードで管理画面上のAPIページ(下記を参照)に表示されています。

piwik_tokens
token参考画面(管理画面上部にあるAPI)
※Piwikがインストールされたサーバー上で実行する場合には–token-authが無くても実行できます。

・解析結果の表示
解析が終わったらダッシュボードを確認してみましょう。

example_report

試しに適当なサーバーのログを解析してみましたが、きちんと解析結果が表示されました。
解析の進み具合はPiwikを導入したサーバーのスペックによって左右されるようで、
今回2コア4GBの仮想サーバーにPiwikをインストールしてテストをしましたが、60行/sの進み具合でした。

 

ユーザー視点を重視したGoogle Analyticsはいまやスタンダードとも言えるポジションを獲得しましたが、
できるだけアウトソーシングせず自社で完結したい、外部にデータを出したくないという要求はあると思います。

サーバーにインストールするアクセス解析ツールにAnalogやWebalizer等がありますが、
もう少しクライアント視点を意識したアクセス解析をお探しの方、是非Piwikをお試しください。

ページの先頭へ