Jubatusを導入して、Tutorialプログラム(※スタンドアロンモード)を動かすまでの手順をまとめました。
■ 前提
- OS X 10.8.3
- MacPorts導入済み
- 2013/4/8にJubatus導入実施
■ Jubatusを導入する
いくつかの方法が整備されているようですが、MacPortsで導入することとしました。
◆参考◆
※MacPortsで導入すれば、homebrewやpipによる導入は不要です。
0. (適宜、)MacPorts自体と既存導入物を更新しておきます。
$ sudo port selfupdate
引き続いて、$ sudo port upgrade outdated
1. Jubatus本体(サーバー)をMacPortsで導入します。
$ sudo port install jubatus
※これで、"opt/local/bin/juba*"な各種実行ファイルや、"opt/local/share/jubatus"ディレクトリが作成されます。
※2013.4.8時点で、バージョン「0.4.2」(※導入実施時点での最新版)が導入されることを確認しました。
$ sudo port install py-jubatus-client
■ Tutorialプログラムを導入する
基本的に本家Webサイトの手順通りに実施します。(※「JubatusおよびJubatus Pythonクライアント」は上記手順で導入済みとなります。)
1. Tutorialプログラムを下記サイトからダウンロードします。
※「git clone」でも、.zipファイルのダウンロードでも、何でも構いません。
2. 下記URLよりテスト用のデータセットをダウンロードします。
3. テスト用データセットを、「1.」でTutorialプログラムを配置したディレクトリに解凍します。
◆説明◆
Tutorialプログラム配置先ディレクトリが、
/path/to/jubatus-tutorial-python
だとした場合、テスト用データセットは、下記のようなサブディレクトリ構成となるように解凍してください。
/path/to/jubatus-tutorial-python/20news-bydate-test
/path/to/jubatus-tutorial-python/20news-bydate-train
■ Tutorialプログラムを実行する
1. まず、Jubatus(サーバー)を起動します。
1-1. Tutorialプログラムを導入したディレクトリに移動します。
$ cd /path/to/jubatus-tutorial-python
1-2. 下記のように、Jubatus(サーバー)を起動します。
$ jubaclassifier -f config.json
※ここでは(Tutorialでは)、Jubatusの「分類器」を起動します。※「-f」オプションと「--configpath」オプションは同義です。(※引数無しで「jubaclassifier」を実行して表示されるusageを見てみてください。)※Tutorialプログラムを動かすためには、Jubatusサーバー起動時に、Tutorialプログラムに同梱されるconfig.jsonを指定する必要があります。誤ったConfigファイルを指定していると、エラーは出ずに、実行結果が全て「NG」になったりするようです。
2. 次に、(別のターミナルを開いて、Tutorialプログラムを導入したディレクトリに移動して、)下記のように、Tutorialプログラムを実行します。
$ python tutorial.py
※構成情報の出力後、下記のような「OK」/「NG」の出力が為されれば成功、です!
【出力例】-----(ここから)-----OK,sci.med, sci.med, 0.508920490742OK,sci.space, sci.space, 0.780809283257NG,sci.med, talk.politics.misc, 0.407847106457NG,talk.politics.mideast, talk.politics.guns, 0.262542843819NG,alt.atheism, talk.religion.misc, 0.492338180542NG,talk.politics.misc, talk.politics.guns, 0.583025813103OK,sci.crypt, sci.crypt, 1.32894003391OK,talk.politics.mideast, talk.politics.mideast, 1.21946406364OK,rec.sport.hockey, rec.sport.hockey, 1.03506875038OK,misc.forsale, misc.forsale, 1.98352277279...-----(ここまで)-----
◆以上
関連記事