Slijede razlike između dviju inačica stranice.
Starije izmjene na obje strane Starija izmjena Novija izmjena | Starija izmjena | ||
racfor_wiki:fdd:speech_to_text [2022/06/08 16:45] dbezuk [Alati] |
racfor_wiki:fdd:speech_to_text [2024/12/05 12:24] (trenutno) |
||
---|---|---|---|
Redak 58: | Redak 58: | ||
Neki od alata koji nude besplatnu verziju za generiranje teksta iz govora su: | Neki od alata koji nude besplatnu verziju za generiranje teksta iz govora su: | ||
+ | |||
+ | |||
+ | **Julius** | ||
+ | // | ||
+ | |||
+ | Softver za dekodiranje s velikim vokabularom namijenjen je za istraživače i programere. Na temelju riječi N-grama i HMM-a ovisnog o kontekstu, može izvesti dekodiranje u stvarnom vremenu na različitim računala i uređajima - od mikro-računala do poslužitelja u oblaku. Za rad, Julius prepoznavač treba jezični model i akustički model za svaki jezik. Najnovija verzija također podržava dekodiranje u stvarnom vremenu temeljeno na Deep Neural Networks-u. Julius je razvijen kao istraživački softver za japanski LVCSR (engl. large-vocabulary continuous-speech recognition)od 1997. godine, a rad je nastavljen u okviru IPA projekta japanskih alata za diktiranje. | ||
+ | Dostupan je na platformama Linux i drugim sustavima baziranim na Unixu, kao i na Windows-u, Mac-u, Android-u i drugim platformama. | ||
**Converse Smartly** | **Converse Smartly** | ||
Redak 65: | Redak 72: | ||
**Dragon** | **Dragon** | ||
+ | // | ||
Aplikacija za profesionalni speech recognition koja nudi besplatnu verziju sa brojnim mogućnostima. Kao svoju primarnu metodu koristi se askutičnim modelom. Akustično modeliranje govora obično je izvedeno na način da se računaju statističke reprezentacije za sekvence vektora značajki iz valnog oblika govora. Sama aplikacija uči značajke riječi kako ju koristimo te s vremenom postaje sve točnija i točnija. Procjenjuje se da može doseći čak 99-postotnu točnost u pretvaranju audiozapisa u tekst. | Aplikacija za profesionalni speech recognition koja nudi besplatnu verziju sa brojnim mogućnostima. Kao svoju primarnu metodu koristi se askutičnim modelom. Akustično modeliranje govora obično je izvedeno na način da se računaju statističke reprezentacije za sekvence vektora značajki iz valnog oblika govora. Sama aplikacija uči značajke riječi kako ju koristimo te s vremenom postaje sve točnija i točnija. Procjenjuje se da može doseći čak 99-postotnu točnost u pretvaranju audiozapisa u tekst. | ||
**AssemblyAI** | **AssemblyAI** | ||
+ | // | ||
Platforma koja nudi besplatnu verziju za obradu prirodnog jezika i speech-to-text. Nudi transkripciju u stvarnom vremenu, dijarizaciju zvučnika, automatsko generiranje interpunkcija ( uskličnika, | Platforma koja nudi besplatnu verziju za obradu prirodnog jezika i speech-to-text. Nudi transkripciju u stvarnom vremenu, dijarizaciju zvučnika, automatsko generiranje interpunkcija ( uskličnika, |