TinySegmenterをRubyに移植
Javascriptだけで書かれたコンパクトな分かち書きソフトウェアであるTinySegmenterをRubyに移植しました。移植してから別実装があるのに気がつきましたが、気にせず公開することにします。
Codereposにアップしてありますので、下記のURLよりダウンロードできます。
http://svn.coderepos.org/share/lang/ruby/ruby_tiny_segmenter/
MeCabに対するTinySegmenterの利点は、Ruby だけで書かれているので、どんな環境でも簡単に動作する点です。インストールも簡単です。Windows環境でMeCabをRubyから扱うのは少し面倒ですが、TinySegmenterならば殆んど問題ありません。
実行例はこんな感じです。
require "tiny_segmenter" words = TinySegmenter.segment("私の名前は中野です") puts words.join("|") # => 私|の|名前|は|中野です
TinySegmenterのページには、TODOに「キラーアプリを考える」がありますが、TinySegmenterはコンパクトなのが最大の特長なので、色々な言語に移植すれば、様々な場面で活躍するような気がします。