2015年10月10日土曜日

【R言語】plotとggplot2におけるヒストグラムの出方って結構違う。

 過去、JBISリーディングサイアーデータを拝借して勝利回数とAEIの関係等見てきました。今回は、単純に「R言語の勉強」という意味合いで・・・「ヒストグラム」を作ります!(イ・マ・サ・ラーッ(笑))

 いやいや。本来的には、まずデータの全体像を見てからこういう細かい作業をやるべきなんですよね。そういう意味では、ヒストグラムは基本なので、備忘録代わりにやってみたかっただけなんです。


やってみたら、けっこう違う・・・



 下記にソースコードとグラフをそのまま載せますが、元データであるJBISリーディングサイアーデータは各年度100位までの抽出なので、「全然勝てない種牡馬族」はもっといるものと思ってご覧ください。今回に関しては「データ集計の勉強用サンプルデータ」ですね。

<ソースコード>
# 同一種牡馬で最大5年分のデータがあるので、aggregate関数で集約します。
aei_entry.dat <- aggregate(cbind(AEI全般,勝利回数) ‾ 種牡馬名,jbis10_14.dat,sum)
  
# 勝利回数のヒストグラム
hist(aei_entry.dat$勝利回数, main = "2010‾14年度国内リーディングサイアーの勝利回数", xlab = "勝利回数")
  


# AEIのヒストグラム
hist(aei_entry.dat$AEI, main = "2010‾14年度国内リーディングサイアーのAEI合計値", xlab = "AEI")



# これだけでも十分かもしれませんが、ちょっとグラフが荒いですよね。
# 同じデータをggplot2で描画するとこうなります。

library(ggplot2)
# 勝利回数のヒストグラム(ggplot2)
ggplot(data = aei_entry.dat) + geom_histogram(aes(x = 勝利回数))




# AEIのヒストグラム(ggplot2)
ggplot(data = aei_entry.dat) + geom_histogram(aes(x = AEI全般))



<他の参考エントリー>
AEIが優秀な種牡馬を調べてみたら・・・やっぱりディープ(略)
http://sapporomkt.blogspot.jp/2015/10/aei.html

過去5年間のリーディングサイアー成績を眺めてみた~ディープインパクトって実際・・・

http://sapporomkt.blogspot.jp/2015/10/5.html

(R言語)readHTMLTable関数でJ2の順位を音速で抜き出す。
http://sapporomkt.blogspot.jp/2015/07/rreadhtmltablej2.html

無料のスクレイピングサービス「import.io」が脅威の進化!(いつのまにか)
http://sapporomkt.blogspot.jp/2015/08/importio.html

【R言語】data.frameの列名変更は全部上書きで。
http://sapporomkt.blogspot.jp/2015/09/rdataframe.html

【R言語】競馬データで「rbind関数」の使い方を覚えよう!
http://sapporomkt.blogspot.jp/2015/09/rrbind.html

0 件のコメント:

コメントを投稿