高橋はるみ知事の記者会見をテキストマイニングしてみた。
http://sapporomkt.blogspot.jp/2015/06/blog-post_17.html
ソースコードとアウトプット。
最小限だとこれぐらいでアウトプット出来ちゃいます。
R最高!RStudioありがとう!
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
library(RMeCab) | |
# ""内に形態素解析にかけたいテキスト文章をベースト。 | |
mecab.data <- RMeCabC("") | |
# ワードクラウド用のパッケージをインストール。 | |
# 僕の環境ではtmパッケージのインストールも求められたので、まだの方は別途入れてください。 | |
library(wordcloud) | |
# min.freqは単語の最低頻出回数。 | |
wordcloud(mecab.data, min.freq = 1, random.order = FALSE) |
こちらは、min.freq=1で指定したもの。とにかく全部出してみるコースです。
こちらは、min.freq=3 でアウトプットしたもの。
発言数を棒グラフで見せるのが一番わかりやすいのだけど、印象強く残すのはむしろこっちがいいかも。
0 件のコメント:
コメントを投稿