データマイニング関連の書籍としてはかなり珍しい「Weka(ウェカ)」の使い方を紹介していたので即購入しました。個人的には大満足の内容でした。
<そもそもWekaって何?>
Weka (Waikato Environment for Knowledge Analysis) は、ニュージーランドのワイカト大学で開発した機械学習ソフトウェア。無料で使えます。以前からGUIで処理するデータマイニングソフトは気にはなっていて、似たようなソフトの「RapidMiner」も遊びで動かしたことはありました。ただ、Wekaでいう「KnowledgeFlow」のような作業プロセスをGUIで設定するやり方が、自分の頭の中になかなか定着しなくって挫折したんですよね・・・。
そんな方にこの一冊は向いているかもしれません。
具体的に「いいね!」と思ったのは以下の点です。
1.機械学習の基礎が学べる
「教師あり機械学習」と「教師なし機械学習」の概要がわかりやすい図表つきで記載されています。「教師あり・なし」は普段からわかったようでわかっていない点だったのでとても参考になりました。教師なし機械学習:
ナイーブベイズ、サポートベクターマシン、決定木、ニューラルネットワーク
教師あり機械学習:
相関ルールマイニング、クラスタリング
2.自然言語処理も学べる
自然言語処理の基礎と形態素解析に使うMeCabの使い方も載っています。後者の方は、ほんのちょっとですが、Webを見れば十分な情報があるので問題ないかと思います。重要なのは、Wekaとの併用で実用的に紹介されていることですね。3.「KnowledgeFlow」の使い方が理解できる!
もうね、これが一番の魅力ですよ。「CSVでデータを突っ込む」「不要なデータを削除する」「データの中身を見る」「(決定木で)分類する」といったひとつひとつのプロセスをGUIのパーツに置き換える思考プロセスがしっかり理解できます。試しに作ったのが下記ですが、たぶん、どななでも使えると思います。※Wekaにはバージョン3.6系と3.7系があります。後者でないとこの本に記載された内容は実行出来ないようです。また、自分はLinuxmint17で動かしましたが、「ソフトウェアの管理」「Synaptic」「apt-get install」でインストールすると3.6系が入ってしまうので、直接本サイトからダウンロードしてください。
全体的は大満足だったのですが、唯一、「うーん」と思った点は、実際のオペレーション説明が「決定木」しかなかったこと。お値段的にもリーズナブルだったので仕方なかったかもしれませんが、出来ればもうひとつぐらい手法を載せて頂きたかったです(「相関ルールマイニング」希望)。
実際、自分もそうなのですが、「まぁ、やろうと思えばRstudioでもいいか」と思う節もあるので、Wekaを日常的に使うためにも、実用的な手法は2・3個出来るようになった方がいいと思うんですよね。
第2弾出版されましたら購入します!
0 件のコメント:
コメントを投稿