" rozpoznat řeč "
r eh k ay ay n y b iy ch
" vrak pěkné pláže "
Proč je to tak složité? Pokud program má slovník 60.000 slov (časté v dnešních programů), sekvence ze tří slov by mohl být kterýkoli z 216 bilionů možností. Je zřejmé, že ani nejsilnější počítač není prohledávat všechny z nich bez pomoci.
To pomoc přichází v podobě programu výcviku. Podle Johna Garofolo:
Tyto statistické systémy vyžadují velké množství příkladů tréninkových dat k dosažení jejich optimální výkon - někdy v řádu tisíců hodin lidské transkripci řeči a stovky megabajtů textu. Tyto údaje školení slouží k vytvoření akustické modely slov, seznamů slov, a [...] víceslovnými pravděpodobnosti sítí. Tam je nějaké umění na to, jak jeden vybírá, zpracovává a připravuje je toto školení dat pro " trávení " v systému a jak modely systémové " naladěni " pro zvláštní použití. Tyto údaje může znamenat rozdíl mezi dobře fungující systém a špatně fungující systém. - I při použití stejné základní algoritmus
Zatímco vývojáři softwaru, kteří nastavit systém je počáteční slovní zásoby plnit hodně z tohoto tréninku, je konec Uživatel musí také strávit nějaký čas trénovat ho. V obchodním prostředí, primární uživatelé programu musí strávit nějaký čas (někdy za pouhých 10 minut) mluvení do systému trénovat ji a na jejich konkrétní vzory řeči. Musí také systém naučit rozpoznat výrazy a zkratky, zejména pro společnost. Speciální edice programů rozpoznávání řeči pro lékařské nebo právnické kanceláře mají pojmy obecně používané v těchto oblastech již vyškolených do nich.
Dále se podíváme na některé slabiny a nedostatky v systémech rozpoznávání řeči.
Rozpoznávání řeči : slabé stránky a nedostatky
Žádný systém rozpoznávání řeči je 100 procent dokonalý; několik faktorů, může snížit přesnost. Některé z těchto faktorů jsou otázky, které i nadále zlepšovat, jak technologie zlepšuje. Jiní mohou být sníženy - ne-li zcela opraveny - uživatel
Low signál-šum
Tento program potřebuje " slyšet ". slova zřetelně vyslovovaných, a žádné další hluk zavedena do zvuku se rušit to. Hluk může pocházet z různých zdrojů, včetně hluku pozadí v kancelářském prostředí. Uživatelé by měli pracovat v tiché místnosti s kvalitním mikrofonem umístěným co nejblíže k jejich úst jak je to možné. Nekvalitní zvukové karty, které poskytují vstup pro mikrofon vyslat signál