| Zope 2.6.x 以降の方は ZCTextIndex版を試してみて下さい |
非常にダサいやりかたですが、茶筅を使って Windowsで日本語のカタログを作れるようにしました。
田原さんの作った JSplitterに比べたら遅くて、信頼性も低いと思うんですが、UNIX系でも、
chasenのコマンドが動けば、日本語のカタログが作れるようになります。
実運用には、私も使いたくないのですが、評価用とか、開発用には使えると思います。
茶筅をインストールします
Windowsバイナリ版のZopeを動かす場合
http://chasen.aist-nara.ac.jp/chasen/distribution.html.ja にある
cha21244.exeをインストールしますが、インストール先ディレクトリを、デフォルトで設定される
C:\Program Files\chasen21 ではなくて C:\chasenにしてください。
その他 Linux/BSD系の実装の場合
http://chasen.aist-nara.ac.jp/chasen/distribution.html.ja
のchasenとipadicの最新版をインストールします。
chasenコマンドが /usr/local/bin/chasen
に存在するようにインストールしてください。
私は、Cygwin環境でソースからコンパイルしたZopeで動作を確認しました。
Windows の場合 日本語Codecsをインストールします。(そうじゃないと動きません)
これを ChaSplitter.py という名前で$(INSTANCE_HOME)/lib/python/Products/PluginIndexes/TextIndex/Splitter へコピーします
$(INSTNACE_HOME)/lib/python/Products/PluginIndexes/TextIndex/Splitter/__init__.py にあるファイルを編集します
availableSplitters = (
("ChaSplitter", "Chasen Splitter"), <----------ここに1行加える
("ZopeSplitter" , "Zope Default Splitter"),
("ISO_8859_1_Splitter" , "Werner Strobles ISO-8859-1 Splitter"),
("UnicodeSplitter" , "Unicode-aware splitter")
)
私は、Zope2.5.0(Windows binaryとCygwin)との組み合わせでうまく行っています。
田原 さん のJSplitter0.2を非常に参考にさせていただきました。
テンポラリファイルを作って
chasen コマンドを起動して
結果をパイプで受け取る
というダサい手法をとっています。とにかく、「動く」ことを最優先で作ってみました。