2019年8月18日日曜日

RESASのローデータをJupyterNotebookで取り込む

Pythonは初学者なので生暖かくご覧くださいw。

RESAS(地域経済分析システム)は、GUIが洗練して使いやすいですが、実は、いくつかの画面では、ローデータを丸ごとダウンロード可能です。

今回は、「RESAS-観光マップ」の「客室稼働率の推移」ローデータをダウンロードし、ローカル端末にインストールしたJupyterNotebookに取り込んで見ます。
JupyterNotebookのインストール手順は、下記エントリーをご覧ください。

macOS MojaveへのAnacondaインストール
https://sapporomkt.blogspot.com/2019/06/macos-majaveanaconda.html

condaコマンドによるAnacondaの仮想環境作成
https://sapporomkt.blogspot.com/2019/06/condaanaconda.html

実施環境は、以下の通りです。
・MacBook Air:CPU:1.6GHz,Memory 8GB
・macOS Mojave ver10.14.5

※本エントリーは、私、小田一弥が一個人として勉強を兼ねて記載したものです。私の勤務先である日本アイ・ビー・エム株式会社の見解・見識ではない、個人としての記載内容としてご覧ください。


JupyterNotebookへのRESASローデータ取り込み手順


以降は、ローカル端末でのJupyterNotebook起動が可能な状態を前提に記載します。
もし、セッティングが難しい場合は、当ブログで何度かご紹介している「Watson Studio」などのクラウド環境でJupyterNotebookを使うアプローチもアリかと思います。

(ご参考)IBM Watson Studio
https://www.ibm.com/watson/jp-ja/developercloud/watson-studio.html


1.RESASページからローデータをダウンロードする。
[メインメニュー]→[観光マップ]→[国内]→[宿泊施設]→[グラフを表示]と進むと、集計画面が表示されます。「宿泊施設」でいくつの選択項目があるのでお好きな項目を選んでOKですが、どの集計画面でも右側に「データをダウンロード」が表示されるので、このボタンを押してローデータをダウンロードしてください。



2.JupyterNotebookにアップする。
ローデータはZip形式になっているので、JupyterNotebookで記述したipyndファイルを置く予定のフォルダと同じフォルダに解凍したローデータをアップ(※)してください。
※「アップ」とは書いていますが、今回のJupyterNotebookはローカル端末のlocalhostで動かしているので、「Cloud上にアップする」ようなイメージではありません。

右上部分にある「Upload」ボタンからファイル指定が可能です。




3.下記コードを実行する。

今回は、「北海道」の宿泊施設データだけを抽出します。
わずか数行のコードなので、特に解説は不要かと思いますが、「os.getcwd()」関数で、これから実行するipyndファイルを置いてある相対フォルダパスを取得し、「os.path.join()」関数でローデータファイル名と繋げています。

import pandas as pd
import os

# ローカルのJupyter Notebookで作業している相対パスの確認
base_url = os.getcwd()
print(base_url)
df_csv = os.path.join(base_url,'観光マップ_宿泊施設.csv')

# csvの読み込み
df = pd.read_csv(df_csv,encoding = "shift-jis")
df_hokkaido = df[df['都道府県名'] == '北海道']
df_hokkaido.head(10)

以下のように表示されれば成功です。
次回は、このデータを使って集計や可視化に取り組んでみます。

0 件のコメント:

コメントを投稿