« UTF-8での全文検索メモ(PostgreSQL + Tsearch2 + MeCab 編) | Main | VPN (L2TP over IPSec) で iTunes 共有ができないんですけど… »

2006.06.09

UTF-8での全文検索メモ(2)

前回の続きです。
Tsearch2 を使ったら、あっさりと Learning Path Finder でシラバスの全文検索ができるようになりました。
http://bavarois.db.tokushima-u.ac.jp/~miyoshi/lpf/ (←β版)

これを本運用サーバの LPF でも使えるようにしようと思い、どこに全文検索用 DB を置こうかと相談したところ、Mac OS X Server 上がいいんじゃない?ってことになりました。
本運用でも FreeBSD だろうという目論見が外れたため、Mac OS X での PostgreSQL + Tsearch2 + MeCab 環境の構築をすることに…。
その Mac OS X Server には fink で既にポスグレが入ってて、Tsearch2 も動いてるっぽい。ってことは、あとは MeCab と pgmecab を入れれば良いということです。
普段 fink を使っていないので、案の定、少しハマってしまったのでメモを残しておきます。

環境
・Mac OS X Server 10.4 (Xserve)
・PostgreSQL 7.4.8 インストール済み (Tsearch2 も動いてる)

方針
・できるだけ fink から
・UTF-8 が使えるように

1. 形態素解析エンジン MeCab (和布蕪) をインストール
 (Fink のヘルプページを参考に unstable なパッケージもインストールできるようにしておく。)
$ sudo fink install mecab
$ sudo vi /sw/fink/10.4-transitional/unstable/main/finkinfo/text/mecab-ipadic.info
 ConfigureParams: の行を書き換える
ConfigureParams: --prefix=%p --libexecdir=%p/lib --with-dicdir=%p/lib/mecab/dic/ipadic --with-mecab-config=%p/bin/mecab-config --with-charset=utf8
$ sudo fink install mecab-ipadic

2. mecab が動くかテストしてみる
(辞書ファイルの場所がおかしい場合は /sw/etc/mecabrc の dicdir を書き換える)

3. pgmecab をコンパイルするのに postgresql のソースが必要なので make しておく
$ cd /tmp
$ tar jxf /sw/src/postgresql-7.4.8.tar.bz2
$ cd postgresql-7.4.8
$ ./configure --prefix=/sw --docdir=/sw/share/doc --mandir=/sw/share/man --enable-multibyte --enable-recode --with-CXX --without-perl --without-python --without-openssl --with-libraries=/sw/lib --with-includes=/sw/include --without-tcl --without-tk --without-java --enable-odbc --with-pam --with-rendezvous --enable-syslog --with-krb5=/usr
(/sw/fink/10.4-transitional/stable/main/finkinfo/database/postgresql74-unified.info を参考に)
$ make

4. pgmecab をインストール
(pgmecab-1.1を展開しておく)
$ cd ~/Desktop/pgmecab-1.1
$ vi Makefile
 次の2行を書き換える
MECAB_CONFIG_PATH = /sw/bin/mecab-config
top_builddir = /tmp/postgresql-7.4.8
$ sudo make install

5. /sw/.../postgresql-7.4 等に入って欲しかったけど、/sw/.../postgresql に入ってしまったので、手作業で移動…orz。
$ cd /sw/share/postgresql/contrib
$ sudo mv pgmecab.sql ../../postgresql-7.4/contrib/
$ cd /sw/lib/postgresql
$ sudo mv pgmecab.so /sw/lib/postgresql-7.4/
$ cd /sw/share/doc/postgresql74-unified/contrib
$ sudo mv ../../postgresql/contrib/README.pgmecab .
(不要になったディレクトリを削除)
$ cd /sw/share
$ sudo rm -r postgresql
$ cd /sw/lib
$ sudo rm -r postgresql
$ cd /sw/share/doc
$ sudo rm -r postgresql

|

« UTF-8での全文検索メモ(PostgreSQL + Tsearch2 + MeCab 編) | Main | VPN (L2TP over IPSec) で iTunes 共有ができないんですけど… »

Comments

日記の内容が俺には難しすぎてコメントできず、論点ズレのコメントですが…。

先日事故に遭い、所持してたPBG4も傷物にorz

修理見積もりしてもらうことになり、結果如何にもよるとは言え、買い替えも視野に入ることに…。

MacBook系、アプリの対応状況がもうちょっと進むまで個人的にはもう少し見送りをと思っていたのに不意の選択…

単純に新しモノ好きな自分との間での葛藤が続きながらも、こうやってPPCから入力してる複雑な心境だったりします…。

Posted by: 馬車猫 | 2006.06.11 at 16:48

> 馬車猫さん、こんばんは。

えと、日記の内容はただのメモですのでお気になさらずに。

っていうか、事故に遭っていたとは…。
今、日記の方を読ませていただきました。
大きな怪我はされていないようでよかったですが、
それでも日記を読む限りではとても痛々しいです。
おだいじに。

今後は保険屋との悶着がありそうな雰囲気ですけど
是非 MacBook Pro を勝ちとっていただきたいなと思いますw。
そんな簡単なものではないんですかね?
保険の話とかはチンプンカンプンです…。

ちなみに、Classicを使っているのでなければ、
今すぐ Intel Mac に乗り換えてもあまり問題ないと思いますよ。
少なくとも僕の使い方では全く困っていませんね…。

Posted by: YasSo | 2006.06.15 at 21:57

Plotterは、インストールや辞書ファイルとか動いてる
ネットでディレクトリとかを構築されたはずだったの♪


Posted by: BlogPetのPlotter | 2006.07.04 at 14:01

Post a comment



(Not displayed with comment.)


Comments are moderated, and will not appear on this weblog until the author has approved them.



TrackBack

TrackBack URL for this entry:
http://app.cocolog-nifty.com/t/trackback/15584/10455956

Listed below are links to weblogs that reference UTF-8での全文検索メモ(2) :

« UTF-8での全文検索メモ(PostgreSQL + Tsearch2 + MeCab 編) | Main | VPN (L2TP over IPSec) で iTunes 共有ができないんですけど… »