Získávání znalostí
/ Knowledge Discovery >> Získávání znalostí >> zdraví >> medicína >> moderní medicína >>

Jak Chřipkové trendy Google Works

i poklepal do své databáze 50 milionů z nejčastěji používaných prefiltered vyhledávacích dotazů k vytvoření základní linie obecného výskytu chřipky. Počáteční algoritmus pro předpovědní nástroj opírala pouze o regionální vyhledávání dat dotazu se chřipky (regionální na základě IP adresy), včetně zastřešujících témat, jako jsou obecné příznaky chřipky, nachlazení a antivirových léků.

Algoritmus porovnává real -time vyhledávací dotaz data - slovo nebo frázi, kterou jste použili jako hledaný termín, například " bolest v krku " - Proti výchozí pro stanovení úrovně regionální aktivity chřipky, v rozmezí mezi pěti klasifikací od minimální po intenzivní. Teoreticky, GFT by mohlo poskytnout aktuální-denní hlášení (téměř v reálném čase) z chřipky a předpovědět propuknutí chřipkové týdny před CDC sestavuje zprávu.

Podle GFT vynálezcům, ačkoli, GFT je reporting v reálném čase se rozumí které mají být použity jako doplňující informace na klinické a virologické údajů v tradiční ostrahy (CDC a svých sítí). Rychlá detekce GFT je určen na pomoc při včasné odhalení nejen epidemiích chřipky, ale také virové identifikaci kmenů a potenciál pro pandemii
GFT:. Model aktualizace, přesnost a Trap
Big data

Před každým nový rok chřipková sezóna, model Google Flu Trends se obnovuje s 45 dotazů nejužitečnějších chřipky související z období před rokem (tyto speciální vyhledávací termíny jsou vybrány pomocí logistické regrese, ale přesné dotazy a jak jsou váženy proti ostatním jsou drženy přísně tajné).

Navíc, odhady posezónní GFT jsou hodnoceny podle tradičních zpráv o dohledu údaje použité CDC, aby viděli, jak dobře dvě utkání. Na schopnosti předpovědní nástroj je přesně odhadnout, kdy té letošní chřipková sezóna začíná, kdy bude vrcholit sezóna, a jak těžké to bude založena, může být model aktualizován. Když to poprvé zahájen v roce 2008, GFT měl průměrnou korelaci 97 procent s CDC údajů [zdroj: Ginsberg].

V září 2009, model pro USA verzi aplikace Google Chřipkové trendy dostal své první aktualizaci, aby zahrnovala vyhledávání dat dotaz z ohniska H1N1. To bylo proto, že modelka GFT je úplně podcenil H1N1 pandemie prasečí chřipky (která se stala v létě). A pak to pokračovalo minout.

V průběhu chřipkové sezóny 2011/2012, GFT přecenil výskyt chřipky o 50 procent. GFT také přecenili 2012/2013 chřipkové sezóny, předpovídá tolik jak dvojnásobek počtu ambulantních návštěv o ILI jako CDC skutečně hlášeny. Na vrcholu 2013

Page [1] [2] [3] [4] [5]