Získávání znalostí
/ Knowledge Discovery >> Získávání znalostí >> technologie >> počítač >> Internet >> web design vývoj >>

Jak Google Knihy Works

a zplošťuje každou stránku, zajistit, že software OCR (optické rozpoznávání znaků) je schopen identifikovat písmena a čísla vytištěná na stránkách digitalizovány. Po naskenování, tyto znaky lze upravovat a prohledávat s počítačem.

Chcete-li eliminovat potřebu skleněných desek a snížení možnosti poškození knih, které chce zachovat, Google patentoval nový proces skenování knih. Pracovníci jednoduše položte knihu na otevřené knihy skeneru, pro který ani skleněná deska, ani žádné jiné zařízení, které by vyrovnejte knihu. Pokročilý software Google skenuje knihy a účty pro zakřivení stránek, což znamená, že to není degradaci rozpoznávání znaků. Tyto skenery pracují rychlostí asi 1000 stran za hodinu.

Google vyvinul dohody s významnými knihovnami pro spuštění projektu. New York Public Library, stejně jako univerzitní knihovny na Harvard, Michigan a Stanfordu, všichni souhlasili, aby společnost Google skenovat jejich svazků. S pomocí těchto institucí, Google již naskenované okolo 12 milionů knih [zdroj: von Lohmann].

rozpínavosti projektu znamená, že jeho největší příslib je poskytnutí přístupu ke knihám, že lidé by se jinak nikdy vidět. Student na Floridě mohou přistupovat speciální indiánské kolekci na druhé straně země. Lidé, kteří si nemohou dovolit cestovat do vidět starověké texty ve Francii by mohl procházet tyto svazky z jejich obývacích pokojů. A díky mimořádné úsilí společnosti Google, zrakově postižené osoby mohou prohlížet knihy na zvětšených zobrazeních používání Braillova písma zařízení, nebo poslouchat dokumenty prostřednictvím čtení nahlas-technologií.

Nejprve Knihy Google plánuje digitalizovat funguje pouze na veřejnosti doména, která tvoří asi 20 procent všech knih [zdroj: Toobin]. Ve Spojených státech, knihy zadat veřejnou doménu 70 let po smrti autora; jako public domain, už nejsou chráněny autorskými právy.

Nicméně, jak Google naskenované, to začalo digitalizaci i autorsky chráněné texty. Společnost nedal materiály chráněné autorskými právy on-line v plném rozsahu, namísto omezování obsahu on-line na asi 20 procent obsahu této knihy. Google prohlašoval, že toto považovalo za použití materiálů chráněných autorskými právy.

Ostatní nesouhlasil. Autoři Guild a Association of American Publishers podal skupinové žaloby, podněcuje diskuse o Google Books ve Spojených státech a po celém světě.
Google Books kontroverzi a navrhla osad

Autorská práva, přístup a zisk otázky jsou v centru d

Page [1] [2] [3] [4] [5]