Překrývání řeč
Aktuální systémy mají potíže oddělovat simultánní řeči od více uživatelů. " Pokusíte-li se použít technologii rozpoznávání v rozhovoru nebo setkání, kde se lidé často přerušují navzájem nebo mluvit jeden přes druhého, budete pravděpodobně získat velice špatné výsledky, " říká John Garofolo.
Intenzivní využívání výpočetního výkonu
Spuštění statistických modelů potřebných pro rozpoznávání řeči vyžaduje procesor počítače udělat hodně těžké práce. Jedním z důvodů pro to je potřeba si pamatovat každou fázi vyhledávání slovo uznání v případě, že systém potřebuje ustoupit přijít s správné slovo. Nejrychlejší osobních počítačů v použití dnes mohou ještě mít potíže s komplikovanými příkazů nebo fráze, zpomaluje dobu odezvy výrazně. Tyto slovníky potřebné v rámci programů také zabírají velké množství místa na pevném disku. Naštěstí, místa na disku a rychlosti procesoru jsou oblasti rychlého pokroku -. Počítačů v užívání 10 let od této chvíle budou mít prospěch z exponenciálnímu nárůstu obou faktorů
homonym
Homonyma jsou dvě slova, která jsou napsána odlišně a mají různé významy, ale znít stejně. " tu " a " jejich, " " Air " a " dědic, " " bude " a " bee " jsou všechny příklady. Neexistuje žádný způsob, jak pro program rozpoznávání řeči poznat rozdíl mezi těmito slovy na základě zvuk sám. Nicméně, rozsáhlé školení systémů a statistických modelů, které berou v úvahu slovní kontextu velmi zlepšili svou výkonnost.
Podíváme se na budoucnost programů rozpoznávání řeči dalších.
Budoucnost rozpoznávání řeči
První vývoj v oblasti rozpoznávání řeči předcházejí vynález moderního počítače o více než 50 let. Alexander Graham Bell byl inspirován k experimentu v přenosu řeči jeho manželkou, kdo byl hluchý. On zpočátku doufal, že vytvořit zařízení, které by se transformovat zvukové slova do viditelný obraz, že hluchý člověk mohl vykládat. On dělal produkují spektrografickou obrazy zvuků, ale jeho žena byla schopna jim rozluštit. Že řada výzkumu nakonec vedl k jeho vynálezu telefonu.
Po několik desetiletí, vědci vyvinuli experimentální metody počítačového rozpoznávání řeči, ale výpočetní výkon k dispozici v době omezená je. Teprve v roce 1990 dělal p