2015年10月7日水曜日

AEIが優秀な種牡馬を調べてみたら・・・やっぱりディープ(略)

 タイトルでほとんどオチを言って感もありましたが・・・。
最近、R言語のお勉強代わりに種牡馬データを使って遊んでいます。その中で「AEIが高い種牡馬」を確かめたくなったので、ちょっとだけ分析してみました。


AEIとは?


 Average Earning Indexの略。種牡馬別の産駒収得賞金に関する指標で、全競走における競走馬1頭あたりの収得賞金に対する、ある種牡馬の産駒1頭あたりの収得賞金の比率をあらわしたもの。

・・・こういう風に書くと分かりづらいですが、「レースに出走した各競走馬の獲得賞金分捕り率を父親別に表した数値」とでも言えばいいでしょうかね。
一般的に、優秀な種牡馬ほど、この率が高くなると言われています。


サンプルデータ


 いくつか前処理があるので、下記エントリーの「サンプルデータ」パートをご覧ください。

過去5年間のリーディングサイアー成績を眺めてみた~ディープインパクトって実際・・・
http://sapporomkt.blogspot.jp/2015/10/5.html


分析してみた


 まずは、2010~2014年におけるリーディングサイアーデータを「出走回数」「AEI全般※」で合算し、各種牡馬の散布図をザクっとプロットしてみました。
※全レース分の「AEI全般」と重賞のみを扱った「AEI重賞」がありますが、今回は前者だけです。


 上記を見ると、「出走回数が極端に少ないのに、ダントツにAEIが高い種牡馬」がいるようです。
出走回数=0のライン近くの一番上にいるのは、「キングズベスト」です(AEI合計値:47.19)。
こちら、元々はアメリカ産の種牡馬で、イギリス2000ギニー等の勝ち馬です。半弟に牝馬で凱旋紋章を制覇した「アーバンシー」等がいます。なつかしー!!

 ちなみに、「出走回数」をX軸に取っていますが、途中から「勝利回数」にしたかったので変更しています。

 このままの状況で、いちいちローデータを開いて種牡馬名を確認するのは面倒です。色々調べていましたら、全部ラベル付けをしてくれる便利な関数(directlabels関数)があったので、下記ソースコードを突っ込んでみたわけです。

 <ソースコード>
library(ggplot2)
library(directlabels)
library(dplyr)

# 5年分の「AEI全般」と「勝利回数」を足す。
aei_entry.dat <- aggregate(cbind(AEI全般,勝利回数) ~ 種牡馬名, jbis10_14.dat,sum)

# 全種牡馬をプロット。
plot1.dat <- ggplot(aei_entry.dat,aes(x=勝利回数, y=AEI全般))+geom_point(aes(colour=種牡馬名))
direct.label(plot1.dat, "smart.grid")


数が多すぎてグチャグチャ・・・。でもプロット別に色分けしてラベル貼りしてくれるのはありがたいですね。まぁ、これでは視認出来ないですし、変にAEIが高いお馬さんも混ざっているので、 「勝利回数の上位30頭」で抜き出してみましょう。
 えっ、なんで、「上位30位」で切ったかったって?それはディー(略)


<ソースコード>
 # 勝利回数上位30頭を抽出。
win_count_30.dat <- aei_entry.dat %>%
dplyr::arrange(desc(勝利回数)) %>% head(30)


# 勝利頭数上位30頭の全種牡馬をプロット。
plot1.dat <- ggplot(win_count_30.dat,aes(x=勝利回数, y=AEI全般))+geom_point(aes(colour=種牡馬名))
direct.label(plot1.dat, "smart.grid")


 「勝利回数」「AEI」ともに高い右上の象限に「キングカメハメハ」先生がいるのはさすがです。
また、ちょっと離れますが、 「クロフネ」「ゴールドアリュール」「シンボリクリスエス」「ネオユニヴァース」「フジキセキ」などもいいポジションにいますね。

 しかーし!やはりAEIトップを見ると、やはり「ディープインパクト」がトップを飾る結果となりました。
まだやっていないですが、「AEI重賞」でアウトプットすると、より顕著な結果になると思われます。


<10月8日(木)追記>
 いちおう、「AEI重賞」でもやってみました。やはり「ステイゴールド」のAEI重賞スコア高くなりますよね。



<参考ページ>
過去5年間のリーディングサイアー成績を眺めてみた~ディープインパクトって実際・・・
http://sapporomkt.blogspot.jp/2015/10/5.html

(R言語)readHTMLTable関数でJ2の順位を音速で抜き出す。
http://sapporomkt.blogspot.jp/2015/07/rreadhtmltablej2.html

無料のスクレイピングサービス「import.io」が脅威の進化!(いつのまにか)
http://sapporomkt.blogspot.jp/2015/08/importio.html

【R言語】data.frameの列名変更は全部上書きで。
http://sapporomkt.blogspot.jp/2015/09/rdataframe.html

【R言語】競馬データで「rbind関数」の使い方を覚えよう!
http://sapporomkt.blogspot.jp/2015/09/rrbind.html

0 件のコメント:

コメントを投稿

Google+ Followers