blog.bouzuya.net

2013-01-15 Kuromoji で読みを使う

bouzuya/clj-kuromoji-example 0.3.0 を公開した。

今回は Kuromoji で読みを得てみた。Token クラスの getReading メソッドを使えば、漢字の読みを得られる。カタカナの場合には読みが得られず nil が返されるので、その場合は getSurfaceForm メソッドで元の文字列を返すようにした。

ソースコードはここから参照

テストコードはここから参照

これで文章の読みを得られている、はず。明日はこれを使って遊ぶ。いやあ簡単だ。こういうライブラリを作ってくださると助かる。

8 min.