2016年11月7日月曜日

ggplot2でクロス集計的に複数グラフをプロットする方法

R(Rstudio)を使って分析を行う際、細かな分析に入る前にザックリとデータ内容を俯瞰したい場合がありますよね。

幾つか方法はあると思いますが、以前、当ブログでご紹介した「gridExtra」パッケージを使う以外に簡単なやり方があったのでご紹介します。

サンプルコードのご紹介


# 必要なパッケージのロード
library(ggplot2)
library(useful)

# もやはおなじみ。ポルトガル銀行のダイレクトマーケティングデータを読み込み。
# ちなみに、「stringsAsFactors」を指定しないと、文字列が勝手に「factor」型に
# なってしまいます。
bank.dat <- read.csv("bank-full_for_R.csv",sep = ";", stringsAsFactors = FALSE)

# データフレーム名を指定するのが面倒なのでattachします。
attach(bank.dat)

# 「x軸にduration(持続時間)、y軸にageを置きます」指示
ggplot(bank.dat, aes(x = duration, y = age)) +
# プロットするポイントの色はy(ダイレクトマーケティングの結果)
geom_point(aes(color=y)) +
# グリッド(格子)のy軸を「education(受けた教育レベル)」、x軸を「marital(婚姻状況)にします」指示。
facet_grid(education ~ marital) +
xlab("duration") +
# angleはx軸の目盛ラベルの角度
theme(axis.text.x=element_text(angle = 45, hjust = 1, vjust=.5)) +
# 最後の行を外すと「1K」が「1000」となってカッコ悪いので。
scale_x_continuous(labels=multiple)


その他のR言語エントリー


R開発環境が無料で簡単導入!「Data Scientist Workbench」を使ってみた。
http://sapporomkt.blogspot.jp/2016/10/rdata-scientist-workbench.html

RMeCabで形容詞の形態素解析をやってみた。
http://sapporomkt.blogspot.jp/2016/07/rmecab.html

(R言語)道内空港間の流通量を可視化してみた。
http://sapporomkt.blogspot.jp/2016/02/r.html
 
【R言語】leafletで札幌市内のサツドラをプロットしてみた。
http://sapporomkt.blogspot.jp/2016/01/rleaflet_4.html

(R言語)当ブログアクセス者の興味関心事をコレポン(コレスポンデンス)した。
http://sapporomkt.blogspot.jp/2015/12/r.htmlhttp://sapporomkt.blogspot.jp/2015/12/r.html