Úvod do Internet Jak vyhledávače pracují
Dobrou zprávou o internetu a jeho nejviditelnější složkou, World Wide Web, je, že existují stovky milionů strany k dispozici, čekají na prezentaci informací o úžasnou paletu témat. Špatnou zprávou o Internetu je, že existují stovky milionů stránek k dispozici, většina z nich s názvem podle rozmaru jejich autora, téměř všechny z nich sedí na serverech s tajemnými jmény. Když potřebujete vědět o určité téma, jak víte, které stránky číst? Pokud jste jako většina lidí, navštívíte internetový vyhledávač.
Internetové vyhledávače jsou zvláštní místa na webu, který je navržen tak, aby pomoci lidem najít informace uložené na jiných webech. Existují rozdíly v tom, jak různých vyhledávačů práce, ale všichni plnit tři základní úkoly:
.
Motory Brzy vyhledávání držel index několik stovek tisíc stránek a dokumentů, a přijal možná jeden nebo dva tisíce dotazů každý den. Dnes, top vyhledávače bude index stovky milionů stránek, a reagovat na desítky milionů dotazů denně. V tomto článku se budeme vyprávět, jak se provádějí tyto hlavními úkoly, a způsobu fungování internetových vyhledávačů dát dohromady, aby vám umožní najít informace, které potřebujete na webu.
Web Crawling
Když většina lidí mluví o internetových vyhledávačů, oni opravdu znamenají Svět webových vyhledávačů široký. Před Web se stal nejviditelnější část internetu, tam už vyhledávače na místě pomoci lidem najít informace na internetu. Programy s názvy jako " Gopher " a " Archie " chované indexy souborů uložených na serverech napojených na internet, a výrazně snižuje množství času potřebného k nalezení programů a dokumentů. V pozdní 1980, jak vážné hodnotu z Internetu znamenalo vědět, jak používat Gopher, Archie, Veronica a zbytek.
Dnes, většina uživatelů internetu omezují jejich vyhledávání na webu, takže budeme omezit tento článek do vyhledávačů, které se zaměřují na obsahu webových stránek.
Před vyhledávač může říct, kde je soubor nebo dokument, je třeba konstatovat. Chcete-li najít informace o stovky milionů webových stránek, které existují, vyhledávač využívá speciální softwarové roboty, tzv pavouci, st