2016年4月23日土曜日

SPSS ModelerでJリーグスタッツ分析(「フィールド操作」編:後編)

 前回は「SPSS Modeler」で「フィールド操作」まわりの操作をご紹介しました。
今回も引き続き、当該操作にてついて触れていきます。

SPSS ModelerでJリーグスタッツ分析(「フィールド操作」編:前編)
http://sapporomkt.blogspot.jp/2016/04/spss-modelerj_23.html

 「そもそも、Jリーグスタッツとはなんぞや?」は下記をご参照ください。

SPSS ModelerでJリーグスタッツ分析(「データ読み込み」編)
http://sapporomkt.blogspot.jp/2016/04/spss-modelerj.html

※本エントリーは、私、小田一弥が一個人として勉強を兼ねて記載したものです。私の勤務先である日本アイ・ビー・エム株式会社の見解・見識ではない、個人としての記載内容である点をご留意ください。

だっふんだぁ~!!「式ビルダー」!!


 見出しに、意味はありません。
「加トちゃんケンちゃんごきげんテレビ」は僕の青春でした(笑)。世代がバレるぜぃ。

1.「テーブル」ノードでデータ確認
 改めてデータを見ると、このシーズンにおける「松本山雅FC」のデータは面白いですね。
「自ポジッション時総走行距離(km)」が 極端に少なかったり、「平均ボール支配率」も唯一の30%台(39.8%)」。

 特にこのレコードだけを言及するのも拙速ですが、上位と下位チームにおいて、どの変数(フィールド)に差があるか といった見方をすると何かわかるかもしれませんね。


2.「フィールド作成」ノードを配置
 今回は「お勉強」ですので、ざっくり、「上位・下位チームの区分けが出来ればいいや」と思ったとします。

 下記のように、「フィールド順序」ノードから「フィールド作成」ノードをつなげてください。
(派生フィールド名が既についているのは無視してください)


3.「式ビルダー」でCLEM式を設定
 単純に「失点より得点が上回っているチーム」にフラグを立てたいと思います。
「式ビルダー」から「得点 >= 失点」と指定します。


4.「テーブル」ノードで確認
 上記3の指示がしっかり反映されているか「テーブル」ノードで確認します。
「失点」より「得点」が上回っているチームには「T」が表示されていますね。



5.「フィールド作成」ノードを配置
 よくサッカー解説では、「とにかく、最後、シュートでしめくくるのはいいですねぇ~」的なコメントがありますよね。単純に「シュートの本数」でセグメントをとったらどうなるのでしょうか。
この場合、「フィールド作成」ノードの派生フィールドから「カテゴリ型」を選びます。
 
 あとは、「フィールド設定値」に判別しやすい値を入力し、「式ビルダー」で下記のような範囲でカテゴリを指定します。念のため、「テーブル」ノードで指示が通っているかチェックしてくださいね。


 ちなみに、「フィールド作成」では、下記6つの方法で新規フィールドを作成できます。

CLEM式:
 指示したCLEM式の結果としてフィールドを作成する。

フラグ型:
 指定した式の結果として、真(T)または、偽(F)のフラグを持つフィールドを作成する。

カテゴリ型:
  指定したカテゴリ型の値を持つフィールドを作成する。

ステート型 :
 フラグ型が1つの条件で真偽を返すのに対し、ステート型は2つの独立した条件に応じてフィールドの値を持ったフィールドを作成する。

カウント型 :
 指定された条件が真(T)である度数(回数)を持ったフィールドを作成する。

条件式  :
 条件に対する値に応じて、2つの式のどちらかの結果としての値を持ったフィールドを作成する。
 

その他:SPSS Moder関連エントリー


SPSS ModelerでJリーグスタッツ分析(「データ読み込み」編)
http://sapporomkt.blogspot.jp/2016/04/spss-modelerj.html
SPSS ModelerでJリーグスタッツ分析(「フィールド操作」編:前編)
http://sapporomkt.blogspot.jp/2016/04/spss-modelerj_23.html

0 件のコメント:

コメントを投稿