Získávání znalostí
/ Knowledge Discovery >> Získávání znalostí >> technologie >> počítač >> Internet >> web design vývoj >>

Expert Stuff: Brýle Mike Cohen

at k tomuto modelu. - jsme to na volání jazykového modelu. Je to statistický model slovních sekvencí, jak pravděpodobné, že různá slova jsou nastat vzhledem k tomu, co nedávná slova byla. Tím, krmení modelu velké množství dat, to prostě počítá všechny tyto statistiky o to, co je pravděpodobné, že dojde příště, a to je jazyk modelu. Takže teď, tyto tři modely, akustický model, nebo model se všemi těmi základními zvuky, lexikonu, nebo model, jak všechna slova získat výraznější, a nakonec jazykový model, nebo jak se všechny ty slova dostat navlečené dohromady dostat zkompilovaný dohromady.

Takže lexikální modely jsou postaveny seřazovat akustických modelů, jazyk je model postaven seřazovat slovo modelů, a to všechno dostane sestaveny do jednoho obrovského reprezentace mluvené angličtině, řekněme, a že se stane model, který dostane se naučil z dat, a že uznává nebo hledání, když někteří akustika přijít a je třeba zjistit, co je můj nejlepší odhad na to, co zrovna řekl.
Jak se vám brát v úvahu akcenty a dialekty při navrhování pro rozpoznávání řeči ?

Jednou ze základních věcí, s ohledem na druh přístupu řízené daty, které bereme, je snažíme se mít velmi velké, široké sady školení. Máme velké množství dat přicházející ze všech druhů lidí se všemi druhy akcentů, řka: všechny druhy věcí, a tak dále a tak dále, a nejdůležitější věc je mít dobré pokrytí ve vaší tréninkové sady, co se blíží , ve Máme dostatek instance Brooklyn akcenty - a ne jen díky mně - ale máme lidi z Brooklynu, který mluvil s našimi systémy, jako že děláme dobrou práci, když se lidé s Brooklyn akcenty mluvit do našeho systému

Na druhou stranu, pokud někdo přišel a měl velmi zvláštní a neobvyklé způsoby, jak vyslovovat věci, které nebylo dobře zahrnuty v našich dat, budeme mít větší potíže jejich rozpoznávání.

Někdy výslovností jsou dost radikálně odlišné, řekněme, že v britské angličtiny proti americké angličtině, můžeme vybudovat samostatný model, nebo částečně smíšené model, nebo cokoliv jiného. To je jakýsi oblasti výzkumu. Kdy bychom měli stavět samostatné modely oproti spojit vše do jednoho velkého modelu, nebo jakéhokoliv kompromisu mezi tím? To variace je jedním z největších výzev, jeden z množství velkých problémů v oblasti, která ztěžuje. Mít dobrý trénink sady je jedním ze způsobů, které řešíme s tím, když je tréninkové sady, které mají široké pokrytí všech těch věcí, které se dějí.
Jaký je rozdíl mezi výpočetní lingvista a řeči technolog

Page [1] [2] [3] [4] [5] [6] [7] [8]