kana2voca

Katakana to Julius voca format converter

Katakana to Julius voca format converter

ICU を利用して、カタカナをローマ字および音声認識エンジン Julius の voca 形式に非同期で変換する Node.js のアドオンです。

git clone して次のコマンドを実行して下さい。

$ npm install kana2voca

C++0x 対応のコンパイラが必要です。

var kana2voca = require('kana2voca').async;
 
kana2voca('キョーハイーテンキダナー', function(errresult) {
    console.log(result);
});

これで次のような出力となります。

ky o: h a i: t e N k i d a n a:

require 時の語尾を async から sync に変えると同期版になります。

node-mecab-async (https://github.com/hecomi/node-mecab-async) と組み合わせると、カタカナだけでない文字列をローマ字に出来ます。

var MeCab     = new require('mecab-async')
  , mecab     = new MeCab()
  , kana2voca = require('kana2voca')
;
 
var str2voca = function(strcallback) {
    mecab.parse(str, function(errresult) {
        var kana = '';
        for (var i in result) {
            kana += result[i][9];
        }
        kana2voca(kana, function(errresult) {
            console.log(result);
        });
    });
}
 
str2voca('今日はいい天気だなぁ', function(errresult) {
    console.log(result);
});

その他詳細は Twitter:@hecomi へご質問いただくか、http://d.hatena.ne.jp/hecomi/ をご参照下さい。