211service.com
Vyhledávací služba, která dokáže nahlédnout do budoucnosti
Zobrazování novinových článků na časové ose bylo vyzkoušeno již dříve. Ale Průzkumník času , prototyp zpravodajského vyhledávače vytvořený v Výzkumná laboratoř Yahoo v Barceloně , generuje časové osy, které se táhnou do budoucnosti i do minulosti.

Cestovatel v čase: Časový průzkumník zobrazuje pokrytí relevantní pro hledaný výraz v průběhu času.
Na stránce s výsledky Průzkumníka času dominuje interaktivní časová osa ilustrující, jak se objem článků pro konkrétní hledaný výraz v průběhu času měnil. Nejrelevantnější články se zobrazují na časové ose a ukazují, kdy byly publikovány. Pokud uživatel přesune časovou osu do budoucnosti, články se zobrazí v libovolném časovém okamžiku, na který by se mohl text odkazovat.
To poskytuje nový způsob, jak objevovat články, a také způsob, jak zkontrolovat minulé předpovědi. Časová osa pro rok 2010 se stává způsobem, jak objevit a 2004 Op-Ed naznačuje, že Severní Korea by nyní zkonstruovala asi 200 jaderných hlavic, popř článek z roku 2007 přesně předpovídat obtížná politická rozhodnutí pro demokraty ohledně vypršení daňových škrtů George Bushe.
Zpravodajské organizace se stále více obracejí k novým způsobům prezentace svého obsahu, včetně vylepšených forem vyhledávání. Výzkumná studie Pew v roce 2008 zjistila, že 83 procent lidí, kteří hledají zprávy online, používá k jejich nalezení vyhledávač.
Průzkumník času dokáže najít jak absolutní odkazy na budoucí časy, jako je listopad 2010, tak pracovat vpřed od data publikace článku, aby zjistil relativní načasování, jako jsou volby příští měsíc. Také extrahuje jména, umístění a organizace uvedené v článcích. Ty jsou zobrazeny v rámečku napravo od výsledků; lze je použít k přidání osoby nebo jiné entity na časovou osu a k doladění výsledků na základě kombinací konkrétních lidí nebo míst.
U válek nebo jakékoli jiné události můžete vidět nejen lidi, kteří jsou důležití, ale i to, kdy se stali důležitými, říká Michael Matthews, člen výzkumného týmu Yahoo. Vývoj zpráv v průběhu času není něco, co můžete udělat velmi snadno pomocí nástrojů, které jsou dnes k dispozici.
Time Explorer byl vytvořen pomocí kolekce 1,8 milionu článků vydaných společností New York Times sahající od roku 1987 do roku 2007 s cílem stimulovat výzkum nových způsobů zkoumání zpravodajství. Time Explorer byl prezentován spolu s dalšími nápady na použití stejné datové sady na zasedání konference Interakce člověka s počítačem a získávání informací (HCIR) workshop v New Brunswick, NJ, o víkendu. Time Explorer získal nejvíce hlasů od účastníků pro nejlepší využití Times články.
Další nástroje prezentované na HCIR se pokoušely posoudit autoritu lidí zmíněných v článku, určit fráze související s hledaným výrazem a rychle dát dohromady stránku shrnující nejnovější zprávy na určité téma, například o celebritě nebo zemi.
U většiny vyhledávačů zpráv je aktuálnost významným faktorem relevance, říká Daniel Tunkelang , technický vedoucí v newyorské kanceláři společnosti Google, který této výzvě předsedal. Time Explorer přináší průzkumnou perspektivu časové dimenze a umožňuje uživatelům vidět vývoj tématu v průběhu času.
Úhledná vizualizace umožňuje uživatelům objevit neočekávané vztahy mezi entitami v konkrétních okamžicích – například mezi Slobodanem Miloševičem a Saddámem Husajnem, říká Tunkelang. Upřesnění hledání termínu Jugoslávie se dvěma vůdci odhaluje, jak se Husajn zprvu jeví jako srovnávací bod v pokrytí srbského vůdce, ale později byli oba vůdci přímo zapojeni a příběhy hlásily obchody se zbraněmi mezi nimi.
Ačkoli Time Explorer v současné době pracuje pouze se starými zprávami, mohl by být také použit k prozkoumání nových zpráv a jejich uvedení do kontextu, říká Matthews. Bylo by těžké aktualizovat v reálném čase, ale určitě by to šlo dělat denně a myslím, že by to bylo určitě užitečné.
Říká, že služba by byla nejlépe nasazena jako nástroj, který funguje mimo témata v přelomovém příběhu. Člověk, který čte zprávy o, řekněme, Medicaid, by považoval za užitečné vidět historii pokrytí tohoto tématu a také předpovědi o jeho budoucnosti, říká Matthews. Je to jako funkce souvisejících článků, ale zaměřená na budoucnost. On a kolegové pracují na přidávání aktuálnějších zdrojů zpráv a také obsahu z blogů a dalších webů do rozsahu Time Exploreru.
The Times digitalizovala a zpřístupnila svůj obsah již od roku 1851, ale dnešní vyhledávací technologie a rozhraní nedokážou učinit tak velké sbírky prozkoumatelnými, říká Evan Sandhaus , člen Výzkumné a vývojové laboratoře New York Times který dohlížel na vydání archivu článků na konci roku 2008.
Můžeme říct: ‚ukaž mi všechny články o Baracku Obamovi‘, ale nemáme databázi, která by nám řekla, kdy se narodil nebo kolik knih napsal, říká Sandhaus, který dodává, že nástroje vyvinuté pro zpracování význam zpravodajských článků by mohl mít širší využití. Tento zdroj pomůže nejen výzkumné komunitě posunout jehlu pro naši společnost, ale pro jakoukoli společnost s rozsáhlým problémem správy dat.
Vzhledem k tomu, že většina organizací ukrývá miliony textových dokumentů, od e-mailů po zprávy, budou pravděpodobně populární chytřejší nástroje pro jejich zpracování, říká Matthews. Teoreticky by základní algoritmy měly fungovat na čemkoli, možná s malým vylepšením.