Участник:VladimirKamarzin/speech: различия между версиями

Материал из ALT Linux Wiki
(Новая: Некоторые записи по распознованию речи. Итак, для построения системы распознавания требуется: sphinx3 и...)
 
Нет описания правки
 
Строка 13: Строка 13:
  Вася v aa ss a
  Вася v aa ss a
  Петя pp ee tt a
  Петя pp ee tt a
Для автоматизированного построения транскрипций следует воспользоваться неким пакетом msu_ru_nsh_clunits, см http://festlang.berlios.de/docu/doku.php?id=russian
Для автоматизированного построения транскрипций следует воспользоваться неким пакетом msu_ru_nsh_clunits, см http://festlang.berlios.de/docu/doku.php?id=russian + nshm выдал спецскрипт, см. http://pastebin.com/m13be4b60
 
[[Категория:Распознавание речи]]

Текущая версия от 21:26, 9 марта 2009

Некоторые записи по распознованию речи.

Итак, для построения системы распознавания требуется: sphinx3 или pocketsphinx (последний у меня падает, так что я пока остановился на 3-м).

http://voxforge.org/home/downloads - Acoustic models. Тарбол включает в себя непосредственно AM, LM, dictionary.

По словам nshm, мне для построения специализирванной системы оттуда требуется только AM. Непосредственно мне нужно построить jsgf (Finite state grammar) http://sphinx.subwiki.com/sphinx/index.php/Finite_state_grammar и создать словарь (dictionary). Последний имеет формат

слово транскрипция

, например

Вася v aa ss a
Петя pp ee tt a

Для автоматизированного построения транскрипций следует воспользоваться неким пакетом msu_ru_nsh_clunits, см http://festlang.berlios.de/docu/doku.php?id=russian + nshm выдал спецскрипт, см. http://pastebin.com/m13be4b60