2015年6月17日水曜日

高橋はるみ知事の記者会見をテキストマイニングしてみた。

 唐突ですが、高橋はるみ知事の「知事記者会見」ページってご覧になっていますか?
こちら、高橋知事と記者団が定例で記者会見している様子を全て「書き起こしている」ページです。
※配布資料もPDFで掲載されるので、「地方創生」の情報ソースとしても結構有用です。



 
http://www.pref.hokkaido.lg.jp/ss/tkk/hodo/kaikenhyoushi.htm


 この書きお越し、重複した言葉づかい、明らかな言い直しがあったものなど以外は高橋知事の発言そのままが掲載されるので、現場の空気感などもわかって読むだけでも楽しいです。

 その一方、仕方のないことですが、本当に「書き起こし」なので「文字たくさん」でちょっと疲れます。
でも・・・全部読まずに、大体の筋だけ知りたいのも人情ですよね?
ということで、今年度における高橋知事の記者会見コメントを全部集めてテキストマイニングしてみました。

<以下作業内容>

・今年度における高橋知事記者会見における知事の発言を全コピペ。
・ただし、コピペ範囲は、冒頭の「知事からの話題」に限る。
※「記者からの質問」は質問者である記者の話題選定に左右されるので除外しました。
・時期は、2015年4月15日~6月15日までの計8回分。
・合計文字数:19,027文字!!

<結果>

とりあえず、Rstudio上でRMeCab使って出現回数の多かった名詞をwordcloudにしてみました。
まぁ、これだけでも何となくですが、わかりますよね。


 ちなみに、こっちが動詞版。「する」が180回と極端に多かったので、意図的に外しました。
原形になるので、「ござる」になるでござる。


 これじゃアレなので、とりあえず、棒グラフも作ってみました。まずは「名詞」バージョン。
「推進」が26回出現していますが、「地方創生」でにぎわっていることも原文を見ると影響していますね。
 また、「人口減少克服」に関する発言が多くなっていることも、「女性」(13回)、「子育て」(8回)が頻出している一因のようです。


 こちらは「動詞」バージョン。「取り組む」(8回)、「目指す」「掲げる」(それぞれ5回)等、政策立案や目標達成に関る意気込みを感じさせる言葉が多く出現しているようです。


 また、いつものパターンでMDS(多次元尺度構成法)やネットワーク分析も載せておきます。
異なるツールを使っているため、ちょっとだけ出た感じが異なっているのはゴメンナチャイ。


 ネットワーク図の右側には、「インバウンド観光客対策の強化」といった文脈も見て取れますね。


 以上です。
 テキストマイニングを活用すると、5分程度で19,027文字を「なんとなく」ですが、感じとることが出来ますよね。最近は無料で様々なテキストマイニングツールが公開されているので、ご興味ある方は是非一緒にお勉強してみませんか?^^

0 件のコメント:

コメントを投稿

Google+ Followers