Získávání znalostí
/ Knowledge Discovery >> Získávání znalostí >> technologie >> elektronika >> gadgets >>

Jak rozpoznávání řeči Works

odeling

systémy rozpoznávání řeči Brzy se pokusil uplatnit soubor gramatických a syntaktických pravidel na řeči. V případě, že slova pronesená zapadají do určitého souboru pravidel, by mohl program určit, co ta slova. Nicméně, lidský jazyk má četné výjimky z vlastních pravidel, i když je mluvené důsledně. Akcenty, dialekty a manýry mohou výrazně změnit způsob, jakým určitá slova nebo fráze jsou mluvené. Představte si, že někdo z Bostonu říkat slova ". Stodoly " Nechtěl vyslovit " r " vůbec, a slovo vyjde rýmovat s ". John " Nebo si vezměme větu, " budu vidět oceán &Quot.; Většina lidí nemá vyslovovat svá slova velmi pečlivě. Výsledek by mohl vyjít jako " Jdu da viz odkopává oceán &Quot.; Oni běží několik slov společně s žádným znatelným přestávky, například " Jdu " a ". oceán " Systémy založený na pravidlech byly neúspěšné, protože oni nemohli zvládnout tyto varianty. To také vysvětluje, proč dřívější systémy nemohly zvládnout souvislé řeči. - Jste museli mluvit každé slovo zvlášť, s krátkou pauzou mezi nimi

systémy rozpoznávání řeči Dnešní používat výkonné a složité statistické modelování systémů. Tyto systémy používají pravděpodobnosti a matematické funkce určit nejpravděpodobnější výsledek. Podle Johna Garofolo, skupina Speech manažer v Informačním Technology Laboratory Národního institutu pro standardy a technologie, dva modely, které dominují pole jsou dnes Hidden Markov model a neuronové sítě. Tyto metody zahrnují složité matematické funkce, ale v zásadě, berou informace známé systému, aby zjistili informace od něj.

The Hidden Markov model je nejvíce obyčejný, takže budeme se blíže podívat při tomto procesu. V tomto modelu, každý fonémový je jako článek řetězu, a hotový řetěz je slovo. Nicméně, větve řetěz z v různých směrech je například program pokusí přizpůsobit digitální zvuk fonému, který je s největší pravděpodobností přijde příště. Během tohoto procesu, program přiřadí pravděpodobnosti skóre na každé fonémová, na základě jeho vestavěný slovník a školení uživatelů

Tento proces je ještě komplikovanější pro frází a vět. - Systém musí přijít na to, kde každé slovo se zastaví a spustí. Klasickým příkladem je výraz " rozpoznat řeč, " což zní hodně jako " vrak pěkná pláž " když to řekl velmi rychle. Program má analyzovat fonémy souslovím, který přišel před ním, aby si to správně. Zde je rozpis dvou vět:

r eh K

Page [1] [2] [3] [4] [5] [6]