2016年4月30日土曜日

SPSS ModelerでWEBアクセス分析も出来ちゃう~時系列グラフ作成

 前回はSPSS Modelerを使ってJスタッツデータにおける選手別走行距離のデータ操作を行いました。

SPSS ModelerでJリーグスタッツ分析~選手別走行距離のヒストグラム経由バンド分け
http://sapporomkt.blogspot.jp/2016/04/spss-modelerj_29.html

 今回は、私のブログ(Sapporo Marketing Blog)に設置したGoogle Analytics(GA)のアクセスデータを使って時系列グラフの作成にトライしてみます。

 下記は、私のGAカスタムレポート画面です。ディメンションは「日付」を使いました。他のディメンションデータと組み合わせて分析すると、更に深い分析が出来そうですね。



※アクセスデータを取得するためには、Google Analyticsの「カスタムレポート」機能を使う必要があります。普段、あまり使わない機能かもしれませんが、意外と簡単なので下記エントリーをご覧になりながら試してみてください。
※もし、当エントリー手順をそのままなぞりたい方は、知人であればアクセスデータを差し上げるのでお声がけください。

「Watson」先生に、AdSenseビンボーの理由を聞いてみた・・・
http://sapporomkt.blogspot.jp/2016/01/watsonadsense.html

※本エントリーは、私、小田一弥が一個人として勉強を兼ねて記載したものです。私の勤務先である日本アイ・ビー・エム株式会社の見解・見識ではない、個人としての記載内容としてご覧ください。
 

時系列グラフの作成手順


1.「可変長ファイル」ノードを配置
 「入力」パレットから「可変長ファイル」ノードを配置し、GAアクセスデータを読み込んでください。ワークシートは2枚目のシート(データセット1)に入っていますのでご留意ください。 

 なお、GAアクセスデータを出力した直後は、各フィールドの合計値が一番下のレコードに入っているので、事前にExcel上で削除しておいた方が楽です。



2.「データ検査」ノードを配置
  「出力」パレットから「データ検査」ノードを配置し、データ内容をチェックしてください。まぁ、400レコード以上あるとはいえ、GAから吐き出したデータなので、不要かもしれませんが、習慣として。


3.「ソート」ノードを配置
 「レコード設定」パレットから「ソート」ノードを配置し、下記のように「日付」でソートしてください。


4.「フィールド作成」ノードを配置(datetime_weekday用)
 SPSS Modelerには時系列分析に便利な関数が数多くあります。「曜日効果」の分析用に日付に対応する曜日データが欲しい場合、下記のようにすると、曜日に該当する数値を得ることが出来ます。

datetime_weekday(日付)
※戻り値は1(日曜)~7 で返します。




5.「フィールド作成」ノードを配置(datetime_day_short_name用)
 1~7の数値でも理解できなくはないのですが、他の方との共同作業などにはちょっと不便ですね。
下記関数を使うと1~7に該当する曜日の短縮形を日本語で返してくれて便利です。

datetime_day_short_name('曜日(数値)') 
※戻り値は日(1)~土 で返します。


 プレビューモードで確認すると、下記のように表示されていると思います。


 ここまでのストリームです。「データ型」ノードは各フィールドの小数点表示修正のために使ったのでマストではありません。


6.「フィールド順序」ノードを配置
 「フィールド設定」ノードから「フィールド順序」を配置し、下記のようにフィールドの並びを変えました(上記5は「テーブル」ノードで一時的に並び替えたものなので)。この方が見やすくていいですよね。


7.「グラフボード」ノードを配置
 「グラフ作成」パレットから「グラフボード」ノードを配置し、「基本」でページビューを選び、「ヒストグラム」を選んだ上で、「詳細」タブで「オプションの外観→色→曜日」を選択してください。



 「OK」を押すと、下記のようなグラフになります。私のブログは土日でPVがあまり稼げていないようですね。スイーツに関することも書きますが、基本はマーケティングやデータ分析に関するエントリーが多いので、ビジネスモードでない日は反応が鈍くなるのでしょうか。



 8.「レコード集計」ノードを配置
「レコード設定」パレットから「レコード集計」ノードを配置し、下記のように選択してください。


 9.「時系列グラフ」ノードを配置
  ここまでの処理で、月別のアクセス数データを利用できるようになっているので、「グラフ作成」パレットから「時系列グラフ」ノードを配置してグラフ化しましょう。



 「ページビュー」数と「オーガニック検索」数がほとんど同じ形になっていますね。以前、同じデータをWatson AnalyticsでPredict(予測)にかけたのですが、もっともページビューと相関係数が高かったのは「オーガニック検索」数でした。

 また、昨年10月頃、突発的にオーガニック検索を集めたエントリーがあったのですが、それ以来同じパターンがないことも見て取れますね。 

 

 最後に今回の全体ストリームを掲載します。次回はもう少し細かくデータを見ていこうと思います。



その他:SPSS Moder関連エントリー


SPSS ModelerでJリーグスタッツ分析(「データ読み込み」編)
http://sapporomkt.blogspot.jp/2016/04/spss-modelerj.html

SPSS ModelerでJリーグスタッツ分析(「フィールド操作」編:前編)
http://sapporomkt.blogspot.jp/2016/04/spss-modelerj_23.html

SPSS ModelerでJリーグスタッツ分析(「フィールド操作」編:後編)
http://sapporomkt.blogspot.jp/2016/04/spss-modelerj_90.html

SPSS ModelerでJリーグスタッツ分析~得失点をサクっとグラフ化


RESASの特許DB全件をSPSS Modelerでデータ分類してみた。 

SPSS ModelerでJリーグスタッツ分析~選手別走行距離のヒストグラム経由バンド分け
http://sapporomkt.blogspot.jp/2016/04/spss-modelerj_29.html

0 件のコメント:

コメントを投稿