Získávání znalostí
/ Knowledge Discovery >> Získávání znalostí >> technologie >> počítač >> počítačový program >>

Jak Komprese souborů Works

še, zemi, mohou udělat, pro, vy - dávají nám téměř vše, co potřebujete pro celou cenovou nabídku. Chcete-li postavit druhou polovinu věty, jen poukázat na nápis v prvním pololetí a vyplňte mezer a interpunkce.

Budeme se zabývat tím, jak soubor-compression systémy vypořádat s redundancí podrobněji v V další části.
redundance a algoritmy

Většina kompresní programy používají variaci LZ adaptivního slovníku na bázi algoritmu zmenšit soubory. " LZ " odkazuje na Lempel Ziv, a tvůrci algoritmu je, a " Slovník " se vztahuje k metodě katalogizovat kusů dat.

Systém pro úpravu slovníky se liší, ale mohlo by to být tak jednoduché, jak číslovaného seznamu. Když jsme se projít Kennedyho slavná slova, vybíráme slova, které se opakují, a dát je do číslované indexu. Pak jsme jednoduše napište číslo namísto psaní mimo celé slovo.

Takže, pokud to je naše dictionary:

  1. ask
  2. what
  3. your
  4. country
  5. can
  6. for
  7. you

    Our věta nyní zní: " 1 ne 2 3 4 5 6 7 srpna-1 02 8 5 6 7 3 4 "

    Pokud jste věděl, že systém, můžete snadno rekonstruovat původní frázi jen s použitím tohoto slovníku a Číslo vzor. To je to, co expanze Program na vašem počítači dělá, když to rozbalí stažený soubor. Dalo by se také setkal komprimované soubory, které se otevírají sebe nahoru. Chcete-li vytvořit tento druh souboru, programátor obsahuje jednoduchý rozšiřující program s komprimovaného souboru. To automaticky rekonstruuje původní soubor, jakmile je to stáhnout.

    Ale kolik místa jsme skutečnosti uložena s tímto systémem? " 1 není 2 3 4 5 6 7 8 - 1 2 8 5 6 7 3 4 ''; je jistě kratší než " Neptej se, co vaše země může udělat pro vás; zeptat se, co můžete udělat pro svou zemi; " ale mějte na paměti, že musíme zachránit slovník sám spolu se souborem

    Ve skutečném kompresní schéma, přijít na to, různé požadavky na soubor by být poměrně komplikované.; ale pro naše účely, vraťme se k myšlence, že každá postava a každý prostor zabírá jednu jednotku paměti. Už jsme viděli, že plné fráze zabírá 79 jednotek. Naše stlačený věta (včetně mezer), zabírá 37 jednotek, a slovník (slova a čísla), také zabírá 37 jednotek. To nám dává velikost souboru 74, takže jsme se snížila velikost souboru velmi mnoho.

    Ale to je jen jedna věta! Můžete si představit, že v případě, že kompresní program pracoval přes zbytek Kennedyho projevu, by bylo najít tyto slova a d

    Page [1] [2] [3] [4] [5]