2017年8月20日日曜日

R言語:グラフィカルなクロス集計が簡単!〜「rpivotTable」パッケージ

以前、当ブログで紹介したことがあるのですが、Rでグラフィカルなクロス集計が可能な「rpivotTable」パッケージがいつの間にか進化していたので改めて触れてみます。

例えばこんなのがGUIで出来ちゃいます

実施環境については、以下の通りです。

・MacBook Air(CPU:1.6GHz,Memory 8GB)
・macOS Sierra ver10.12.3
・RStudio ver 1.0.136


パッケージ呼び出し後は、全部GUIで出来ちゃいます


分析対象データの読み込みが終わっていれば、下記3行のコードだけでグラフ作成画面が表示されます。
CRANからインストール出来るのでとてもラクですね。

install.packages("rpivotTable")
library(rpivotTable)
rpivotTable(hotel.dat)

下記は、某旅行サイトに記載されたユーザーレビューからRate:満足度ランキング(5が最高)、sex:レビュー記載者の性別、age:年代を抽出したデータです。
これの変数名がついたボタンはドラッグ&ドロップが可能で、3重クロスも難なく出来ちゃいます。

ちなみに、以前は日本語が表示出来なかったのですが、現バージョンでは問題なさそうですね。

<Table>

<Table Barchart>

 <Heatmap>

<Horizontal Bar Chart>

<Horizontal Stacked Bar Chart>

<Bar Chart>

<Line Chart>

<Area Chart>

グラフタイプは他にも数種類ありますので、ご興味ありましたらお試しください。

自分は、このデータをもとにテキストマイニングを行い、形態素解析後に集計されたTerm(ワード)と上記3つの属性を混ぜ混ぜして色んなことをやろうと思っています。
Rにはクロス集計用のパッケージがいくつかあるので、そちらを使ってもいいのですが、データの概観をとりあえず確認するときは「rpivotTable」パッケージが便利だと思います。

以上です。


R関連エントリー


R言語:starwarsキャラの身長や年齢をdplyrで加工してggplot2する。http://sapporomkt.blogspot.jp/2017/08/rstarwarsdplyrggplot2.html

RESASの不動産取引データでheatmapを作ってみた。
http://sapporomkt.blogspot.jp/2017/05/resasheatmap.html 

RESASデータを「IBM Data Scientist Workbench」でゴニョゴニョしてみた。
http://sapporomkt.blogspot.jp/2017/05/resasibm-data-scientist-workbench.html

ggplot2でクロス集計的に複数グラフをプロットする方法
http://sapporomkt.blogspot.jp/2016/11/ggplot2.html

R開発環境が無料で簡単導入!「Data Scientist Workbench」を使ってみた。

http://sapporomkt.blogspot.jp/2016/10/rdata-scientist-workbench.html

(Bluemix)知ってた?dashDBってTwitter分析にもツカエルのさ(+ちょっとだけコンサドーレ調べ)
http://sapporomkt.blogspot.jp/2016/07/bluemixdashdbtwitter.html

RMeCabで形容詞の形態素解析をやってみた。
http://sapporomkt.blogspot.jp/2016/07/rmecab.html

【R言語】今年は、leafletでマップをグリグリしたい。
http://sapporomkt.blogspot.jp/2016/01/rleaflet.html

(R言語)当ブログアクセス者の興味関心事をコレポン(コレスポンデンス)した。
http://sapporomkt.blogspot.jp/2015/12/r.htm

0 件のコメント:

コメントを投稿