ja-compromise は、英語の JavaScript ライブラリ nlp-compromise を日本語で移植したものです。
このプロジェクトの目標は、小さくて基本的なルール ベースの POS タグを提供することです。
ja-compromise
(妥協) is a port of compromise in japanese.
The goal of this project is to provide a small, basic, rule-based POS-tagger.
import nlp from 'ja-compromise'
let doc = ldv('小さな子供は食料品店に歩いた')
doc.match('#Noun').out('array')
// [ '子', '食料品店']
またはブラウザで
<script src="https://unpkg.com/de-compromise"></script>
<script>
let txt = '小さな子供が食料品を買いました。 彼はとても怖がっていた'
let doc = jaCompromise(txt)
console.log(doc.sentences(1).json())
// { text:'小さな子供が食...', terms:[ ... ] }
</script>
see en-compromise/api for full API documentation.
参加して助けてください! - please join to help!
指示: / Contributing
git clone https://github.com/nlp-compromise/ja-compromise.git
cd ja-compromise
npm install
npm test
npm watch
See also
- spacy/japanese - python tagger/tokenizer, by explosionAI
- meCab - C/C++ tokenizer/tagger, by Taku Kudo
- fugashi - Cython wrapper for MeCab, by Paul O'Leary McCann
- janome - python tokenizer/tagger, by Tomoko Uchida
- sudachi - tokenizer/tagger, by Arseny Tolmachev