Tak, že nám říká něco o tom, co se děje na delší vzdálenosti, a to iv rámci těchto omezení předpoklady o statistice, co jsme schopni modelovat s takovou modelu.
Jaké jsou gramatiky?
Ano, to slovo bylo použito volně, a to znamenalo několik různých věcí v průběhu času. V nejobecnějším smyslu, mohl si myslíte, že to jako popis toho, co bychom mohli očekávat, pokud jde o to, co slovo řetězce se může stát. V některých systémech, a to bylo velmi pravdivé pro mnoho call-centra systémů, měli bychom docela dobrou představu o tom, co lidé byli dost pravděpodobné, že řekl, že jo? Máte systém, který je menu, chceš A, B, nebo C? Dalo by se očekávat, že většina lidí bude říkat buď " A " " B, " nebo " C, " nebo oni by mohli říct, " chci A " nebo " B, prosím, " nebo podobné věci, věci, které z důvodu uplatnění byly poměrně předvídatelný
Ale byly jazyky, kterými lidé mohli specifikují ". Zde jsou pravidla nebo soubor řetězců, že lidé by se říci, v tomto konkrétním kontextu. " To by byl případ, kdy bylo rozpoznávání velmi omezený. To by uznat pouze určité množství variací v tom, jak byste mohli říkat věci. Řekněme, " chceš zůstatek účtu nebo provést převod "?; Není to jako lidé budou napodobovat přesně ta slova, ale je to rozumně předvídatelné, takže někdo se zkušenostmi, a po poslechu některé údaje, by mohla mít rozumnou možnost psaní explicitní gramatiku, který říkal, " Zde je 50 variant, jak lidé by mohli dělat, že obousměrný volby ".
vzhledem k tomu, jak se dostanete k více náročné aplikace, jako je například hlasové vyhledávání, je to mnohem více obtížné předvídat všechny ty různé řetězců slov, které lidé mohou pronést. Takže místo toho, gramatika se stane, co se nazývá statistický gramatiku, nebo to, co jsme často volají jazykový model, statistický. To by bylo něco víc ve formě, vzhledem k tomu, poslední dvě slova byla A, B, zde jsou pravděpodobnosti přes všechna slova v mém jazyce, co se může dít dál.
Kolik slov je v hlasovém vyhledávání Google databáze?
A triliony.
Takže dovolte mi, abych to takhle. Pro angličtinu, strany slovní zásoby, počet různých slov v našem slovníku je zhruba milion, a časem, který se vyvíjí, protože, samozřejmě, nová slova zadejte jazyk, nová jména pojď, tak dále a tak dále, takže dostane nově objevený čas od času,