yandex-speechkit-talk-recognition

Распознавание больших файлов через Yandex SpeechKit.

Распознавание длинных аудио - документация

Что делает

Конвертирует файл в OGG Opus
Заливает файл на Yandex Object Storage
Отправляет файл на распознавание
Дожидается результата (проверка раз в 10 секунд)

Данные сохраняет в ~/yandex-stt/.

Установка

npm install -g yandex-speechkit-talk-recognition

Зависимости

ffmpeg 4.x (3.4 не подойдёт)

Как запустить

Создать сервисный аккаунт, получить API ключ (в документации), вписать его в config.js.
Создать статический ключ, получить Id и Secret
Запустить yandex-stt --file <путь_к_файлу_с_голосом>, создастся конфиг в ~/yandex-stt/config.js.
Заполнить конфиг
Запускать yandex-stt --file <path> или yandex-stt --id abcde`

Стоимость

Распознавание с низким приоритетом (deferred) стоит примерно 15 копеек/минута, грубо говоря, 10 руб/час. Тарифы.

TODO:

Права на файлы. У каждой операции должен быть владелец. Он может обновлять файлы
Изменение filename
Изменение распознанного текста

yandex-speechkit-talk-recognition

Что делает

Установка

Зависимости

Как запустить

Стоимость

TODO:

Readme

Keywords

Package Sidebar

Install

Weekly Downloads

Version

License

Unpacked Size

Total Files

Last publish

Collaborators

yandex-speechkit-talk-recognition

Что делает

Установка

Зависимости

Как запустить

Стоимость

TODO:

Readme

Keywords

Package Sidebar

Install

DownloadsWeekly Downloads

Version

License

Unpacked Size

Total Files

Last publish

Collaborators

Weekly Downloads