2014年12月30日火曜日

Twitter分析に便利? Bounding Box検出ツール

 現在、Rubyの勉強中でして、Twitter API(Streaming)を叩いて北海道の口コミ分析など出来ないか試行錯誤中です。
このStreaming APIですが、誰でも閲覧可能なTweetを1,000分の1サンプリングで自由に取得することができます。「なんだ、1,000分の1かよっ!」と思うかもしれませんが、かなりの量なので10分程度受信し続けるだけでかなりのデータ量を取得出来ます。

 そして、この中でもマーケティング的に遊べそうなのが「各Tweetに紐付いたGPS(位置情報システム)データ」です。私は、バッテリー消費が心配なので普段はオフにすることが多いのですが、意外に常時「スマートフォンのGPS(位置情報システム)」をオンにされているTwitterユーザーが多いようです。

 今年、私は会社の社会貢献活動の一環で札幌市内の高校1年生に「インターネットに関わるリスク啓蒙講座」を行ったのですが、その際に行ったアンケートでも「常時GPSをオンにしている」学生は10%以上いました。

 この情報を取得するときに重要になるのが「Bounding Box」です。ようは、自分が指定したいエリアを緯度・経度の座標情報を使って範囲指定することなのですが、うまく活用すれば「(ほぼ)北海道エリアをカバーする」といったことも可能になります。 ただ、この座標情報を取得するのにいままで四苦八苦していたのですが、とっても便利なサイトがあったのでご紹介します。

 使い方はとっても簡単。

1.まずは、下記サイトにアクセス。名称が、なんともド直球ですね。
<Bouding Box>
http://boundingbox.klokantech.com/















2.画面左上の「Find a place with OpenStreetMap...」欄に「hokkaido」と入力すると、いくつか候補になるエリアが表示されるので選択。














3.左下にある「Copy&Paste」を「CSV」にすると、Bouding Boxエリアを表す座標情報が表示されます。














 いままでかなりわかりづらいサイトでデータ取得していたのですが、これなら数分でBouding Boxデータを入手することが出来ます。

  次回は、ただいまお勉強中のRubyを使って、「北海道エリアにおけるTweetデータの取得」をやってみます。

Linuxmint17でMS Office Online(EXCEL)を使ってみる。

  データサイエンティストや開発系の方なら普通だと思いますが、マーケティング職でLinuxユーザーって少ないですよね。東京と比べると、札幌では更に少ないような気がします。一昔前はインストールの段階で躓くことが多かったLinuxディストリビューションですが、最近はクリック連打で簡単に設定出来るので、是非トライして欲しいと思っています。

 それでも「Linuxって、MS Office使えないんだよね・・・」 と言われると、
「・・・ですよ・・・ねぇ」とヒヨってしまいがちですが、そんなあなたには「MS Online」がおすすめです。
MS OneDrive上にあるファイルなら、通常のMS Officeソフトと遜色ない表示が可能です。

<MS Onlineで表示したExcelグラフ>















<Libre Office Calcで表示したExcelグラフ>














 グラフ画像は、口コミサイトからレビュー文章を抜き出してテキストマイニングした後、Windows上でグラフ化したものですが、Libre Officeだとグラフオブジェクトと項目として別セルに入れた文字ががずれちゃうんですよね。しかも、グラフ、無意味に反転表示したままだし。

 Windowsマシンのように精緻なものは出来ませんが、簡単なグラフであれば十分ビジネスユースでも耐えられると思います。
 
 もし、ご自宅で眠っている中古マシンがありましたら、一度トライされてはいかがでしょうか?