Získávání znalostí
/ Knowledge Discovery >> Získávání znalostí >> technologie >> počítač >> počítačový program >>

Jak Komprese souborů Works

alší mnohokrát více časů. A, jak uvidíme v další části, bylo by to i přepisování slovník, aby co nejvíce efektivní organizaci je to možné.
Vyhledávání Patterns

V našem předchozím příkladu jsme si vybral všechny opakovat slova a dát těm, ve slovníku. Pro nás, to je nejvíce zřejmý způsob, jak napsat slovník. Ale kompresní program to vidí úplně jinak: To nemá žádnou představu o jednotlivých slov - vypadá to pouze pro vzory. A aby se co nejvíce zmenšit velikost souboru, je pečlivě vybírá, které vzory mají být zahrnuty do slovníku.

Pokud se blížíme k frázi z tohoto pohledu, skončíme s úplně jiným slovníku.

V případě, že kompresní program naskenovaný Kennedyho frázi, první redundance, že by narazit bude jen pár dopisů dlouho. V " zeptejte se, co vaše, " tam je opakovaná vzor dopisu " t " následovaný mezerou - v " není " a ". to, co " Pokud program kompresní napsal do slovníku, mohlo by to napsat " 1 " Pokaždé, když " t " byl následovaný mezerou. Ale v této krátké věty, tento vzor nenastane dost, aby to stojí za to záznam, takže program by nakonec jej přepsat

Další věc je program všimnout, je ". Ou, " který se objeví v obou " Vašeho " a ". country " Pokud by se jednalo o delší dokument, psaní tohoto vzoru do slovníku může ušetřit spoustu místa - " ou " je docela obyčejná kombinace v anglickém jazyce. Ale jak se kompresní program propracoval této věty by bylo rychle zjistit lepší volbou pro slovníkového hesla: Nejen, že je " ou " opakoval, ale celá slova " vaše " a " country " jsou oba opakoval, a oni jsou vlastně opakuje spolu, jak fráze " vaše země &Quot.; V tomto případě by program přepsat slovníku položku " ou " se vstupem na ". vaší zemi "

Termín quot; můžete udělat pro " je také opakuje, jeden čas následuje " Vašeho " a jeden čas následuje " ti, " dává nám opakovaný vzor " může udělat pro vás &Quot.; To nám umožňuje napsat 15 znaků (včetně mezer) s jedním číslem hodnotou, zatímco " vaše země " nechává jen nám napište 13 znaků (včetně mezer) s jedním číslem hodnotu, takže by program přepsat " svou zemi " Vstup jen jako " r zemi, " a pak napsat samostatný vchod pro " může udělat pro vás &Quot.; Program pokračuje tímto způsobem, zvedl všechny opakov

Page [1] [2] [3] [4] [5]