2016年2月29日月曜日

道民の除雪イライラ具合をTwitterのセンチメントで図ってみた。

 あまり知られていないかもしれませんが、Twitterの「高度な検索」では「センチメント」でつぶやきを抽出できます。

Twitterの「高度な検索」
https://twitter.com/search-advanced?lang=ja



Twitterのセンチメントとは?


 Tweet内の文言に含まれている文言をTwitter側が「ポジティブ」「ネガティブ」に自動判別しています。具体的な振り分けルールは不明ですが、イメージで言うと下記にあるような感じです。

例:
「ポジティブ」:「好き」「良い」「明るい」等
「ネガティブ」:「嫌い」「悪い」「暗い」等
 

今回やったこと


 下記条件に該当するTweetを収集しグラフ化しました。
なお、サンプリングをかけていますので、下記条件に合致した全Tweetではないのでご留意ください。
 
・検索ワード:(除雪 or 除排雪 or 排雪)
・検索エリア:北海道
・収集期間:2015年11月12日(木)~2016年2月27日(土)
・収集Tweet数:3,453件

 

結果


 

 以前、当ブログでも書きましたが、札幌に初ドカ雪が降った日(2015年11月24日(火))は、除雪車の出動が遅れたこともありネガティブなTweetが多かったようです。


「札幌を中心とした北海道のドカ雪」に関するTwitterを分析してみた。

http://sapporomkt.blogspot.jp/2015/11/twitter_28.html

 その後は、札幌のみならず全道でも降雪が始まりました。道民の皆さんが除排雪に慣れたことも影響したためか、ポジティブとネガティブの差はあまり出ていないのが興味深いですね。

 普段は、収集したTweetをテキストマイニングにかけてもいるのですが、ブログの書き込みと比べると情報量が足りないため、腹落ちする結果が出せないことも多々あります。

 今回のように、単純に「ポジネガの傾向を時系列で見る」というアプローチ、カロリーもかからないですし、案外アリなんじゃないかなと思っています。

(R言語)道内空港間の流通量を可視化してみた。

 Qiitaに下記面白エントリーがあってちょっと話題になりましたね。

R言語 - transitionPlot による空港間流通量の可視化
http://qiita.com/uchim/items/b863255020e20498d2a9

「道内空港間だけで見たらどうなるかな?」と思い、クロス集計までソースコードそのまま流用させて頂きました。

ホントは最後までR言語で処理しようかなと思ったのですが、クロス集計結果を「write.table関数」で吐き出してからExcel使った僕は意気地なしですごめんなさい。。



集計結果について


 使用したデータは、国交省が提供する下記サイトの平成26年度データです。

空港間流通量 第1.1版
http://nlftp.mlit.go.jp/ksj/gml/datalist/KsjTmplt-S10b-v1_1.html

 冒頭のQiitaエントリーでは、空港間流通量のクロス集計データを「transitionPlot」でグラフ化していますが、流通量の数値幅が大きいとやや見づらくなるケースもあるかと思います。

 よって、楽をして、Excelで数表にしてみました。
 このままでは見づらいと思いますので、クリックしてご覧ください。


  集計前、空港間流通量の合計は、「北海道の空の玄関」こと、「新千歳空港」が圧倒的に多いのだろうなぁと思っていたのですが、実際は、「函館空港」や「旭川空港」の方が多いのですね。

 確かに「ドル箱路線」と言われる、「羽田~新千歳空港間」等や、アジア圏に発着枠を振り分けた方が儲かりますもんね。 道民としては、観光やビジネスの利便性を考えると道内地方空港への路線を積極的に作って欲しいところもありますが・・・。


R言語関連のエントリー


【R言語】leafletで札幌市内のサツドラをプロットしてみた。
http://sapporomkt.blogspot.jp/2016/01/rleaflet_4.html

【R言語】今年は、leafletでマップをグリグリしたい。
http://sapporomkt.blogspot.jp/2016/01/rleaflet.html

【R言語】factor型で数値を集計するときの注意点
http://sapporomkt.blogspot.jp/2016/01/rfactor.html

【R言語】ベクトルにおける関数の使い方
http://sapporomkt.blogspot.jp/2015/12/r_80.html 

【R言語】「rpivotTable」パッケージが高機能過ぎて泣ける件
http://sapporomkt.blogspot.jp/2015/11/rrpivottable.html

【R言語】どうしても「ディープインパクト」全産駒の内訳を集計したくなったの<前処理編>。
http://sapporomkt.blogspot.jp/2015/10/r.html 

AEIが優秀な種牡馬を調べてみたら・・・やっぱりディープ(略)
http://sapporomkt.blogspot.jp/2015/10/aei.html

過去5年間のリーディングサイアー成績を眺めてみた~ディープインパクトって実際・・・
http://sapporomkt.blogspot.jp/2015/10/5.html

(R言語)readHTMLTable関数でJ2の順位を音速で抜き出す。
http://sapporomkt.blogspot.jp/2015/07/rreadhtmltablej2.html

【R言語】data.frameの列名変更は全部上書きで。
http://sapporomkt.blogspot.jp/2015/09/rdataframe.html

【R言語】競馬データで「rbind関数」の使い方を覚えよう!
http://sapporomkt.blogspot.jp/2015/09/rrbind.htm

2016年2月21日日曜日

「鶴雅ビュッフェダイニング札幌」が3月1日より新サービス開始!

 こんにちは、「鶴雅ウォッチャー検定」があったら1級ぐらいはとれそうな気がしている僕がお伝えしますよ。

http://www.tsuruga-buffet.com/news/detail.php?id=62

変更内容


(1)営業時間
「お出かけいただきやすい時間帯に」と書かれていますが、確かにバイキング形式なので、あまり早い入場開始時間よりやや後ろめの方が便利ですね。

【ランチ】90分制
2月まで11:00~15:00(最終入場14:00、LO14:30)
3月より11:30~15:00(最終入場14:00)
【ディナー】120分制
2月まで17:00~22:00(最終入場21:00、LO20:30)
3月より日~木(祝前日除外)17:30~21:30(最終入場20:30)
     金~土、祝前日17:30~22:00(最終入場21:00)
ランチ営業、日曜営業


(2)ランチビュッフェの一般席予約スタート!
 これは嬉しいサービスですね! 前回、僕が利用したのは旧道庁(赤レンガ)が見れる窓際の席でした。綺麗な景色を見ながらのお食事は良い思い出になりました。

※1名様からの一般席ご予約も可能です。

窓際席の様子をご覧になりたい方はこちらをどうぞ。
(もっと早く行けば良かった・・・)鶴雅ビュッフェダイニング札幌のランチバイキング
http://sapporomkt.blogspot.jp/2015/12/blog-post.html


(3)ルームチャージの料金設定がさらにわかりやすく。
「個室風小間席(2~4名利用)」が500円。これなら気軽に利用出来ますね。
デートの時などもよろしいのではないでしょうか。


 また、ディナー時間帯では、シニアの方を対象とした「シニア割」も始まっていますが、それよりも魅力的なのは「レイトタイムサービス」。下記時間帯であれば、通常、大人4,200円のところ、3,500円になります!

 これ、札幌駅周辺で深夜まで働く方々には嬉しいサービスですよね。このお値段なら、ちょっと頑張れば行けるって感じがします!

日曜日~木曜日(祝祭日を除く) pm8:00~(90分間)
金曜日・土曜日・祝祭日 pm8:30~(90分間)


その他:鶴雅グループ関連エントリー


 【3000円でも安い!】「定山渓 鶴雅 森の謌(もりのうた)」ランチバイキングと日帰り入浴
http://sapporomkt.blogspot.jp/2015/06/blog-post_8.html

鶴雅グループが函館に進出!!
http://sapporomkt.blogspot.jp/2015/07/blog-post_8.html

本日(6/22)より「大沼鶴雅オーベルジュエプィ」先行予約開始!!
http://sapporomkt.blogspot.jp/2016/06/622.html

スイーツの品数が2倍!?鶴雅「森の謌(うた)」のランチバイキング
http://sapporomkt.blogspot.jp/2015/09/2.html

「しこつ湖鶴雅 水の謌(うた) ランチビュッフェ」に行くので口コミを分析したの。
http://sapporomkt.blogspot.jp/2015/11/blog-post.html

オフシーズンこそ「あかん湖鶴雅ウイングス!」〜家族連れには最高な宿。
http://sapporomkt.blogspot.jp/2016/03/blog-post.html

2016年2月19日金曜日

「リサーチの仮説力」を高める「インプット/アウトプットサイクル」の構築

 先日、某自治体様のお仕事で「マーケティングリサーチ研修」をさせて頂きました。
具体的な背景や目的等は一切開示出来ないので恐縮ですが、周辺自治体様も含めて130名様程も集まって頂きました。
(当初は「20~30名ぐらいかなー」と思っていたのですが)

 最近の自治体様は、「地方創生」でもマストになっている「アウトプット(やったこと)からアウトカム(達成できたこと)」という言葉の通り、「具体的数値で見せること」が重要になっているそうです。そのため、「見える化」の手法としての「マーケティングリサーチ」のニーズが高まっているとのことでした。

当エントリーの結論です。後ほど改めて言及します。

研修会場の様子

「リサーチは、仮説が命!」



 研修のレベル感としては「基礎レベル」を想定していたため、 高度な分析手法等、難しいことは触れないよう心がけました。
 ただ、地味なイシューながらも、これだけは強調したかったんですよね。

「リサーチは、仮説が命!」

 仮説が不十分なまま設計された調査回答データにいくら高度な分析をしても、綺麗なグラフを作っても、ダメなものはダメ。結果的にコストや費用もムダになります。

 そこで、「じゃ、どうやってリサーチの仮説力を高めるの?」というお話です。それぞれ考え方の違いはあると思いますが、個人的には下記のような枠組みだと考えています。


 「手法や方法論で頭でっかち」になる前に、 「インプットをしっかりやりましょう」という
お話です。この点は当然だと思いますが、意外に疎かになりやすいのが「アウトプット」
 あくまでも東京で働いていた際との比較ですが、札幌はお仕事に関してもやや「寛容」なところがあり、「データでシビアに裏取りをした提案(アウトプット)」は若干少ない気がします。

 加えて申し上げたいのが、「単発ではなく、継続的にインプット/アウトプットを繰り返す」こと。
ただ「気合い」だけでは、心が折れて続かないですよね・・・。


  そんなこんなで、オススメしたいのが「日常的なインプット/アウトプットサイクル」の構築です。
イメージとしては、冒頭の図【再掲】です。


 このインプット・アウトプットをグルグル繰り返せば、自然に仮説力も高まってくるかなと。
その中で特に重視したいのは、「デジタル」の活用。小難しい話ではなくて、「インプット」については「便利なツールを活用して、自分なりのアンテナを作りましょう」といったお話です。

  「アウトプット」に関しては、「ちょっとした勇気」も必要になると思います。「Real・Digital」問わず、世の中に対して情報発信することは、心理的にもカロリーが必要な作業ですので。

そろそろ、「なんか、概念的な話ばっかりでつまんなーい」って言われそうなので、具体的事例(?)をご紹介。


 「よくある営業サイクル」って言ってしまえば、そうなんですが、重要なのはこれを「意識的に設計して繰り返すこと」だと思っています。個人的には「営業にも役立つし、リサーチ仮説力の強化にもなるし、一石二鳥なサイクルだなー」と思っていますが、皆様はどのようなお取り組みをされていますでしょうか。是非、勉強させて頂きたいので、Facebookやメールで教えてくださいm(_ _)m

 また、当研修も一緒に担当した部下の相沢直人は「カスタマージャーニーマップ研修」等も手掛けておりますので、お気になる方がいましたら彼に直接お声掛けください。

<参考エントリー>  
ミライストカフェでカスタマージャーニーマップワークショップやりました!
http://designhokkaido.blogspot.jp/2015/08/blog-post.html

2016年2月17日水曜日

5分で作れる!Watson Analyticsで激ラクなレポート作成。

 過去3回に分けて、Watson Analyticsに関するエントリーを書きました。

分析の常識が変わる?「Watson Analytics」すげー!!【Explore】
http://sapporomkt.blogspot.jp/2016/01/watson-analytics.html

「データ・ビジュアライゼーション」でも便利な「Watson Analytics」【Explore】
http://sapporomkt.blogspot.jp/2016/01/watson-analytics_13.html

「Watson」先生に、AdSenseビンボーの理由を聞いてみた・・・【Predict】
http://sapporomkt.blogspot.jp/2016/01/watsonadsense.html

 これらは、Watson Analyticsの下記機能を順番にご紹介しようかなと思い、続けてきたのですが・・・

・Explore :データの中から関連のあるものや傾向をビジュアルに把握する機能。
・Predict :SPSSテクノロジーを利用した予測分析機能。
・Assemble :インタラクティブで効果的なグラフィカルなダッシュボードを作成可能。


・・・もう、機能の勉強をするのが、面倒だよ、パトラッシュ・・・。


と、言うことで、ほぼ予習無しで「Assemble」機能を使ってWatson Analyticsのレポート作成を試みました。
※正確に言いますと、下記公式サイトの記事を20秒ほど(も見てないと思いますが)、流し読みした程度の知識でスタートしました。

【使ってみよう! Watson Analytics-その③】分析結果の共有 ? Assemble機能編
http://asmarterplanet.com/jp-software/blog/2015/01/watson-analytics_assemble.html


5分で出来ちゃうレポート


 これです。何度かカチャカチャ動かして試行錯誤しながらだったのですが、作業時間は10分程度。
もう一回同じものを作るのであれば、5分あれば十分かなと思います。
もちろん、「予習無し」だったので、後で調べたらもっと綺麗、かつ、高度なものも作れることがわかりました。とはいえ、初見で10分で作れるんなら個人的には大満足です。



ご紹介するほどでもないぐらい、簡単な作業手順。

 
過去エントリーと比べても、拍子抜けするぐらい簡単な作業手順です。

1.「Assemble」ボタンを押す。
 Watson Analyticsにログインし、Welcome画面の「Assemble」ボタンを押してください。
別画面が表示されるので、以前の作業でアップロードしたデータを選択してください。


2.Dashboardのレイアウトを選択。
 レポート(Dashboard)のデザインフォーマットとなるレイアウトを選択します。僕はせっかちなのでデフォルト画面から下記を選択しました。


3.テキストオブジェクトを配置。
 データは僕のブログアクセスデータなのですが、「実務で使う」ことをイメージして、レポートの概要を記載するテキストボックスを置いてみました。
「オブジェクト内改行」や「太字」指定は出来ますが、フォントサイズ変更まで出来ると嬉しいですね。


4.データオブジェクトを配置。
 下部にグラフの元になるデータオブジェクトがあるので、Dashboard上にドラッグ&ドロップしてください。右下をつまむと、PowerPointのような感じで手軽にサイズ変更可能です。


5.グラフの見た目やサイズを調整。
 先ほどのオブジェクトを選択するとメニューが表示されますが、グラフアイコンをクリックすると下記のようにビジュアライゼーションを変更できます。ExcelやPowerPointの自由度はありませんが、使用方法で迷う部分は殆ど無いと思います。



6.データ共有もラクラク♪
 作ったレポートはWatson Analytics上でシームレスにメールやダウンロード等で共有が可能です。
当エントリー冒頭のスクリーンショットはPDFでデータ共有したものをキャプったのですが、他にも画像(PNG)でも出力可能です。



  いかがでしたでしょうか。
エントリーユーザー向けに用意されているYoutube動画などを見ると、もっと、高度で綺麗なレポートを作成することも可能なようです。

 専門知識が一切不要でこんなレポーティングが出来るなんて、素晴らしい時代になりましたね。

2016年2月13日土曜日

【札幌イイコト07】「さっぽろ暮らしまなBOOK」配布はじまります!

 2015年の年末から苦労して進めてきた「さっぽろ暮らしまなBOOK」。
遂に2016年2月15日(月)から配布が始まりますっ!!

さっぽろ暮らしまなBOOK



「さっぽろ暮らしまなBOOK」ってなに?


 札幌市消費者センターが推進する「消費者教育」事業の一環で、札幌市内で実施されている「消費者教育に類する取り組み」を200件も掲載したガイドブックです。

「さっぽろ暮らしまなBOOK」特設サイト

http://www.shohi.sl-plaza.jp/shiroukuma.html
※2016年2月15日(月)までは予告サイトとして概略のみ掲載です。



「消費者教育」とは?


 消費者庁が以前から展開している重要施策です。下記4つの重点領域に関する情報を消費者が主体的に学んでもらうことで、「より良い社会づくり」を実現することを目的としています。


<4つの重点領域>
・消費者市民社会の構築
・商品等の安全
・生活の管理と契約
・情報とメディア


 年々多様化・増加する消費者からの問い合わせに機動的に対応するためにも非常に重要視されている「消費者教育」。なんと、本カタログ事業は全国で札幌市が初の取り組みとなっており、全国の関係者からもかなり注目されているそうです。

 また、「消費者教育」の特徴の一つとして、「幼児期からシニア期まで、全ての年代を対象としている」点があげられます。例えば、幼児期において、「約束はしっかり守ろうね」といった情操教育的な部分も消費者教育の領域に含まれます。
他にも、「シニアの方がスマートフォンでトラブルにあわないスマホ教育」といった取り組みも「ドストライクな消費者教育」と言えます。

 当プロジェクトは、部下の相沢直人と昨年末から日々ケンカしながら苦労して創り上げてきました(笑)。その他にも弊社クリエイティブも徹夜しながら取り組んだ一冊となっています。
2月15日(月)から札幌市内で10,000部程配布する予定ですが、特設サイトからもPDF版がダウンロード出来ますので、是非、ご覧ください!

2016年2月3日水曜日

データサイエンスの初歩~「予測モデリング」と「教師あり学習(supervised learning)」ってなに?

 すいません、すいません。いままでわかったフリしていましたが、いよいよそんなノリでは済まされない状況になりまして。「データサイエンスの初歩」を勉強しなおしてます・・・。

そもそも「予測モデリング」って・・・



 「モデリング」を大別すると「分析的なモデリング(descriptive modeling)」と「予測モデリング(predictive modeling)」に分けられます。

 うわっ、いきなり難しそう・・・なんて心配は御無用です。
例えば、「クレジットカードの顧客情報分析」を例にとるとこんな感じです。


「分析的なモデリング(descriptive modeling)」
→加入から6カ月以内に解約した率は●●%。

「予測モデリング(predictive modeling)」
→加入から6か月以内に解約すると予測される率は●●%。


 もう少し実務的な例をあげてみましょう。


現在、僕は広告代理店でマーケティングリサーチもやっていますが、
「新商品キャンペーンの広告認知率は20%でした」的なアウトプットが「分析的なモデリング(descriptive modeling)」。

これに対して、
「ネット広告で1,000万円露出すると、認知率が20%になると予測されます」的なアウトプットが「予測モデリング(predictive modeling)」となります。

 分析的なモデリングは、「過去から現在までに起こったことを対象とした分析」、予測モデリングは「現在から未来を予測するための分析」といったところですね。
職場環境やエリアにもよると思いますが、前者の方が馴染みがある方も多いと思います。


「教師あり学習(supervised learning)」・・・誰や、オマエさん?


 予測モデリングを勉強すると必ず登場するコトバです。
毎回、この手の本を読んで思うわけですよ。「もうちょっとわかりやすいネーミングはなかったのか?」と(笑)。
とはいえ、決まったものはしゃーないのでザックリ覚えちゃいましょう。


「教師あり学習(supervised learning)」
教師あり学習(きょうしありがくしゅう, 英: Supervised learning)とは、機械学習の手法の一つである。事前に与えられたデータをいわば「例題(=先生からの助言)」とみなして、それをガイドに学習(=データへの何らかのフィッティング)を行うところからこの名がある(Wikipediaより)


うーん、わかるようでわかんない・・・。

「教師あり学習(supervised learning)」は、「分類」と「回帰」に分けられます。
今回のエントリーの流れ上、後者に絞って説明した方がわかりやすいので、簡単な例を考えてみましょう。


アイスクリーム屋の売上高 = 当日の気温 + キャンペーンの割引率 + 広告出稿量・・・

 左側が「目的変数」、右側の幾つもの要素を「説明変数」と言います。
例えば、
「過去三年分の上記目的変数と説明変数がセットになった(日付毎に保存された)データを、「教師あり学習(supervised learning)」でなんかやってくれるヤツ(分析ツール)に放り込むとアイスクリーム屋の売上高を予測してくれる」といったイメージです。

 ここで重要なのは「目的変数」は、分析者が意思をもって決める必要があること。「データをドーンと一式でツールに放り込むと売上高がわかっちゃう」という世界ではないんですね。

 また、「教師あり」という名前の由来にもなっていますが、「予測するには、実例を教えてくれる教師がいなきゃダメ。ちゃんと予測方法教えてね」というノリなので、「学習のためのデータ」がある程度必要になってきます。


 とりあえず、今回は「データサイエンスの初歩的な知識」に絞ってみました。
次回以降は、R言語も使いながらグラフ等をアウトプットして遊んでみようかと思っています。


<その他参考エントリー>
【Bookreview】「知りたい分かりたい人の体験する機械学習」
http://sapporomkt.blogspot.jp/2015/06/bookreview_11.html