@doc-tools/sentenizer

0.0.0 • Public • Published

sentenizer

sentenizer — rule-based NLP library for sentence segmentation with russian language support

api

sentenize

takes text of type string and returns segmented sentences as string[]

type

sentenize :: string -> string[]

usage

const {sentenize} = require('sentenizer');

const text = 'Он купил фрукты - яблоки, бананы, и т. д. все были очень рады угощению. Вот такой он добродушный наш родственник И. В. Иванов.';

const sentences = sentenize(text);
// sentences:
// [
//  'Он купил фрукты - яблоки, бананы, и т. д. все были очень рады угощению.',
//  'Вот такой он добродушный наш родственник И. В. Иванов.'
// ]

Package Sidebar

Install

npm i @doc-tools/sentenizer

Weekly Downloads

82

Version

0.0.0

License

MIT

Unpacked Size

96.7 kB

Total Files

41

Last publish

Collaborators

  • martyanov-av
  • moki
  • yc-ui-robot
  • yfm-team
  • monsterzz
  • buran
  • yndx-birman111