たなかこういちの資料室

システム開発に携わる筆者があれこれ試したことや学んだことについてのまとめ

JubatusをMacに導入してみた

Jubatusを導入して、Tutorialプログラム(※スタンドアロンモード)を動かすまでの手順をまとめました。
 
■ 前提
 
- OS X 10.8.3
- MacPorts導入済み
- 2013/4/8にJubatus導入実施
 
Jubatusを導入する
 
いくつかの方法が整備されているようですが、MacPortsで導入することとしました。
 
◆参考◆
MacPortsで導入すれば、homebrewやpipによる導入は不要です。

 

0. (適宜、)MacPorts自体と既存導入物を更新しておきます。
 
$ sudo port selfupdate
 
引き続いて、
 
$ sudo port upgrade outdated
 
1. Jubatus本体(サーバー)をMacPortsで導入します。
 
$ sudo port install jubatus
 
※これで、"opt/local/bin/juba*"な各種実行ファイルや、"opt/local/share/jubatus"ディレクトリが作成されます。
※2013.4.8時点で、バージョン「0.4.2」(※導入実施時点での最新版)が導入されることを確認しました。
 
2. Python版クライアントライブラリーをMacPortsで導入します。
 
$ sudo port install py-jubatus-client
 
Tutorialプログラムを導入する
 
基本的に本家Webサイトの手順通りに実施します。(※「JubatusおよびJubatus Pythonクライアント」は上記手順で導入済みとなります。)
 
 
1. Tutorialプログラムを下記サイトからダウンロードします。
 
 
※「git clone」でも、.zipファイルのダウンロードでも、何でも構いません。
 
1-2. .zipファイルをダウンロードした場合は、アーカイブを解凍します。
 
2. 下記URLよりテスト用のデータセットをダウンロードします。
 
3. テスト用データセットを、「1.」でTutorialプログラムを配置したディレクトリに解凍します。
 
◆説明◆
Tutorialプログラム配置先ディレクトリが、
/path/to/jubatus-tutorial-python
だとした場合、テスト用データセットは、下記のようなサブディレクトリ構成となるように解凍してください。
/path/to/jubatus-tutorial-python/20news-bydate-test
/path/to/jubatus-tutorial-python/20news-bydate-train
 
Tutorialプログラムを実行する
 
1. まず、Jubatus(サーバー)を起動します。
 
1-1. Tutorialプログラムを導入したディレクトリに移動します。
 
$ cd /path/to/jubatus-tutorial-python
 
1-2. 下記のように、Jubatus(サーバー)を起動します。
 
$ jubaclassifier -f config.json
 
※ここでは(Tutorialでは)、Jubatusの「分類器」を起動します。
※「-f」オプションと「--configpath」オプションは同義です。(※引数無しで「jubaclassifier」を実行して表示されるusageを見てみてください。)
※Tutorialプログラムを動かすためには、Jubatusサーバー起動時に、Tutorialプログラムに同梱されるconfig.jsonを指定する必要があります。誤ったConfigファイルを指定していると、エラーは出ずに、実行結果が全て「NG」になったりするようです。
 
2. 次に、(別のターミナルを開いて、Tutorialプログラムを導入したディレクトリに移動して、)下記のように、Tutorialプログラムを実行します。
 
$ python tutorial.py
 
※構成情報の出力後、下記のような「OK」/「NG」の出力が為されれば成功、です!
 
【出力例】
-----(ここから)-----
OK,sci.med, sci.med, 0.508920490742
OK,sci.space, sci.space, 0.780809283257
NG,sci.med, talk.politics.misc, 0.407847106457
NG,talk.politics.mideast, talk.politics.guns, 0.262542843819
NG,alt.atheism, talk.religion.misc, 0.492338180542
NG,talk.politics.misc, talk.politics.guns, 0.583025813103
OK,sci.crypt, sci.crypt, 1.32894003391
OK,talk.politics.mideast, talk.politics.mideast, 1.21946406364
OK,rec.sport.hockey, rec.sport.hockey, 1.03506875038
OK,misc.forsale, misc.forsale, 1.98352277279
...
-----(ここまで)-----
 
◆以上
 

関連記事