Jak Digg bojuje s podvodníky

Digg , populární agregační web, nově definuje způsob, jakým mnoho lidí nachází zprávy. Přibližně 850 000 registrovaných uživatelů účinně působí jako redakční tým, který doporučuje – nebo vykopává – příběhy, které považují za dostatečně zajímavé pro domovskou stránku webu.





Vizuální mapa chování při kopání na Digg. Vodorovná osa představuje uživatele Digg; nejnovější jsou úplně vpravo. Vertikální osa představuje příběhy; nejnovější jsou dole. Každá tečka na mapě představuje výkop, přičemž červené tečky patří k prvnímu výkopu příběhu. Vodorovné bílé čáry představují kopání do oblíbeného příběhu. Svislé bílé čáry však nepopisují typické chování při kopání a mohou představovat aktivitu robota.

Úkolem je zabránit nežádoucímu obsahu a zajistit, aby byly příběhy propagovány legitimně. Někteří lidé se pokoušejí hrát se systémem a nečestnými prostředky se snaží zvýšit šanci příběhu dostat se na hlavní stránku. Motivace: peníze a sláva. Články na domovské stránce Digg obvykle generují mnoho ziskových zobrazení stránek pro zdroj příběhu. Herní pokusy probíhají mnoha různými způsoby. Někteří lidé vytvářejí falešné uživatelské účty a software nazývaný boti, který je navržen tak, aby automaticky kopal příběhy. Jiní hráči píší vymyšlené rozhovory se slavnými lidmi a zveřejňují je na podezřele nových blozích v naději, že zvýší návštěvnost jejich webu.

Podle zakladatele společnosti Digg, Kevina Rose, je stránka navržena tak, aby uživatelé mohli sledovat chování při kopání a vlastní policii. Je například možné zobrazit historii uživatelů, kteří vykopali příběh: pokud má příběh velký počet vykopávek od lidí s nově vytvořenými uživatelskými účty, je pravděpodobné, že byl propagován nespravedlivě, potenciálně od jednoho uživatele, který si účty vymyslel. . Členové pak mohou pomocí nástrojů pohřbít příběhy, které si podle nich nezaslouží být na titulní stránce.



Podezřelá aktivita může být také zmařena pomocí velkého množství dat o normálním chování při kopání, které Digg shromáždil z minulého používání. S více než dvouletými zkušenostmi a statistickou a behaviorální analýzou vzorců odesílání a propagace legitimního obsahu – k dnešnímu dni zastoupených více než 1 200 000 obsahy a 50 000 000 Diggy – tomuto procesu velmi podrobně rozumíme, říká Rose.

Najít smysluplné vzory v gigabajtech nezpracovaných dat není snadné. Některé nástroje pro vizualizaci dat však lze použít ke snazšímu odhalování podezřelé aktivity. Grafickým znázorněním uživatelské aktivity můžeme začít vidět vzory, které by jinak nebyly normálně patrné, říká Eric Rodenbeck, zakladatel Tyčinka , návrhářská firma, která poskytuje vizualizační nástroje pro Digg Labs. Stamen vyvinula Digg Labs, která zahrnuje vizualizační nástroje tzv Zásobník Digg a Digg Swarm . Tyto nástroje ukazují chování uživatelů Digg v reálném čase a pomáhají uživatelům najít oblíbené příběhy různými způsoby.

Digg Swarm je dobrým příkladem toho, jak tento druh vizualizace funguje, říká Rodenbeck, který není zástupcem Digg. Vizualizace vám neřekne vše o aktivitě, kterou pozorujete, ale může osvětlit vzory, které vám mohou poskytnout lepší představu, kam se podívat.



Například Stamenova vizuální mapa (viz obrázek výše), navržená technickým ředitelem Michal Migurski , nabízí jiný pohled na chování při kopání. Na tomto obrázku jsou členové Digg znázorněni na vodorovné ose, přičemž nejnovější členy jsou zcela vpravo a nejstarší zcela vlevo. Příběhy jsou znázorněny na svislé ose, přičemž nejnovější je dole a nejstarší je nahoře. Každá tečka na mapě představuje jeden výkop, přičemž červené tečky patří k prvnímu výkopu příběhu.

Některá chování okamžitě vyniknou, vysvětluje Rodenbeck. Zvažte přerušované vodorovné bílé čáry. Ty ilustrují příběh, který se dostal na hlavní stránku a získává řadu názorů od různých čtenářů. Přerušované svislé bílé čáry však mohou představovat podezřelé chování při kopání: zobrazují jednotlivého uživatele, jak kopá velké množství příběhů – nově zaslaných i starších – v rychlém sledu. Z Rodenbeckových důvodů je nepravděpodobné, že jeden člověk vyprodukoval tolik vykopávek pro tak velké množství příběhů. Je mnohem pravděpodobnější, že tyto diggy byly automaticky generovány roboty ve snaze uměle propagovat určité příběhy, říká.

Dává nám to docela dobrý obrázek o tom, co se děje, říká Rodenbeck, ale je to vždy jen částečný obrázek. Je třeba zmapovat mnohem více parametrů, říká. Mapováním stejných dat pomocí různých metrik, jako je nedávná aktivita konkrétního uživatele nebo počet kontaktů či přátel, na Digg, které vytvořil, se objevují různé typy vzorů. Můžeme nejen lépe porozumět tomu, co se aktuálně děje v ekosystému Digg, ale také lépe porozumět tomu, jaké druhy otázek bychom měli klást, říká Rodenbeck.



Doposud kombinace občanské policie a vizualizace dat fungovala dobře, aby bylo hraní na Digg relativně minimální. Ačkoli Digg nevede statistiky o počtu herních pokusů od spuštění stránky na konci roku 2004, Rose říká, že žádná organizace nebyla schopna úspěšně hrát Digg, pokud je nám známo.

Těm uživatelům, kteří jsou podezřelí, že používají svůj účet (účty) k pokusu o hru Digg, je zaslán varovný e-mail. Uživatel je zablokován po druhém porušení.

Rodenbeck si myslí, že chytré vykreslení sociálních dat Digg pomáhá v boji proti podvodníkům. Vizualizace nemůže vyřešit problém hraní jednou provždy, říká. Ale rozhodně to může zjednodušit proces objevování vzorců a my si myslíme, že to má velkou hodnotu.



skrýt