211service.com
Výzkumníci přeměňují Twitter na sportovního komentátora v reálném čase
Globální lidskou populaci lze považovat za geograficky distribuované multimodální senzory, říká Siqi Zhao z Rice University v Houstonu a několik kamarádů.

A pokud je to tak, Twitter firehose prezentuje hodnoty z těchto senzorů.
Již nějakou dobu víme, že tento senzorový systém poskytuje aktualizace v reálném čase o významných událostech, jako jsou zemětřesení, lesní požáry a úmrtí celebrit.
Ale co častější, rychle se měnící události, zeptejte se Zhao a spol.
Aby to zjistili, tito kluci shromáždili tweety během herní doby 101 zápasů amerického fotbalu v sezóně 2010-2011. To je celkem 19 milionů tweetů od 3,5 milionů tweeterů.
Porozumět těmto tweetům není nic hrozného. Nejprve Zhao a kamarádi museli oddělit tweety související s fotbalem od ostatních. To je složité vzhledem k tomu, že pouze 11 petcentů tweetů obsahuje hashtagy označující jejich téma.
Poté museli vyřešit, na kterou hru se každý tweet vztahuje. Opět to může být obtížné, když se může hrát až 10 her současně, ačkoli Zhao a spol. říkají, že 60 procent tweetů souvisejících s hrami obsahuje názvy týmů.
Dále museli zjistit, kdy k „události“ skutečně došlo; věci jako přistání, zachycení, fumble a branky z pole. Dělají to pomocí dvoufázového procesu, který hledá tato klíčová slova a měří míru, s jakou se objevují v daném časovém okně. Pokud post rate stoupne nad určitou předem stanovenou hranici, pak systém rozhodne, že k této události došlo.
Nakonec to vše musí systém dělat v reálném čase od požární hadice až 800 tweetů za sekundu
Ukázalo se, že se správným druhem filtrování může Twitter poskytnout pozoruhodně přesný komentář, přesný během několika sekund. Zhao a spol. říkají, že v průměru tweeterům trvá nahlášení herní události 17 sekund.
Je zvláštní, že jejich systém fungoval dobře na všech fotbalových zápasech, které monitorovali, kromě jednoho: samotného Super Bowlu.
Je to proto, že samotný počet tweetů o této hře zřejmě nasytil schopnost Twitteru je distribuovat. Zhao a spol. tedy nebyli schopni zaznamenat nárůst míry zobrazování klíčových slov.
Kromě toho se zdálo, že tito kluci narazili na skvělý způsob, jak vytvářet komentáře v reálném čase. Většinu technik lze snadno aplikovat na mnoho dalších sportovních her, říkají. I když tyto hry by vyžadovaly podobně velkou fanouškovskou základnu. Fotbal a baseball jsou jasnými kandidáty a spuštění automatického sportovního komentáře nemůže být daleko pozadu.
Technika má však důležité omezení. Funguje pouze pro události, ve kterých jsou klíčová slova známá předem – věci jako „cíl“ nebo „home run“ a tak dále. Když nastanou neočekávané události, systém zapomíná.
To naznačuje zřejmou linii budoucího výzkumu: najít způsob, jak rozpoznat důležité, ale neočekávané události. Budeme se těšit na to, co Zhao a spol.
Ref: arxiv.org/abs/1106.4300 : Lidé jako senzory sociálních a fyzických událostí v reálném čase: Případová studie Twitteru a sportovních her