Když se těžba na sociálních sítích pokazí

Komplexní obraz vašeho osobního života lze nyní poskládat pomocí různých veřejných zdrojů dat a stále důmyslnějších technik dolování dat. Ale jak přesný je ten obrázek?





Minulý týden v Las Vegas na konferenci o počítačové bezpečnosti Černý klobouk , Nákupy Alessandro , docent informačních technologií a veřejné politiky na Heinz College na Carnegie Mellon University, ukázal, jak lze použít fotografii osoby k nalezení jejího data narození, čísla sociálního pojištění a dalších informací pomocí technologie rozpoznávání obličeje. k přiřazení obrázku k profilu na Facebooku a dalších webových stránkách. Acquisti uznává dopady této práce na soukromí, ale varuje, že největším problémem by mohla být nepřesnost této a dalších technik dolování dat.

Acquisti říká, že jeho současná práce je pokusem zachytit budoucnost, do které jdeme. V této budoucnosti vidí, že online informace budou používány k předsudku osoby na mnoha úrovních – jako potenciální datum, dlužník, zaměstnanec, nájemník atd. Říká, že internet by se mohl stát místem, kde každý zná vaše jméno – celosvětovým malým městem, které vás nenechá ničím přežít.

Kromě zjevných obav z toho, že o vás cizinci vědí víc než kdy jindy, se Acquisti obává toho, co se stane, když technologie udělá chyby. Máme tendenci dělat silné extrapolace o slabých datech, říká Acquisti. S tím se nedá bojovat, protože je to v naší přirozenosti.

Řada společností již začala využívat sociální média k měření a sledování reputace. Společnost Santa Barbara, Kalifornie Sociální inteligence , například provádí screening na sociálních sítích u potenciálních zaměstnanců a slibuje, že odhalí negativní informace, jako jsou rasistické poznámky nebo sexuálně explicitní fotografie, nebo pozitivní informace, jako jsou známky vlivu sociálních médií v určité oblasti. Ostatní společnosti, jako např Klout , sledovat úroveň sociálního vlivu uživatelů, což inzerentům umožňuje nabízet speciální odměny těm s vysokým skóre.

Ale Acquistiho výzkum ukázal úskalí kladení přílišné relevance na data sociálních sítí. Jeho tým pořídil fotografie dobrovolníků a použil běžně dostupný rozpoznávač obličejů tzv PittPatt (nedávno získala společnost Google), aby našli facebookový profil každého dobrovolníka – který často odhalil skutečné jméno této osoby a mnohem více osobních informací. Pomocí těchto informací mohl tým někdy zjistit část čísla sociálního zabezpečení osoby. Vytvořili také prototyp aplikace pro chytré telefony, která stahuje osobní informace o osobě poté, co byla zachycena fotoaparátem zařízení.

Ve svém experimentu byl tým schopen přiřadit asi jednu třetinu subjektů ke správným profilům. Odtud dělali další předpovědi. V 75 procentech případů správně předpověděli zájmy subjektů. Správně předpověděli prvních pět číslic čísel sociálního zabezpečení dobrovolníků asi v 16 procentech času na dva pokusy. (Přesnost se zvýšila s více pokusy.)

To ale znamená, že ve dvou třetinách případů neidentifikovali lidi správně. A ti, kteří byli správně identifikováni, byli ve 25 procentech případů stále nesprávně přiřazeni k určitým osobním zájmům a ve více než 80 procentech případů k nesprávnému číslu sociálního zabezpečení.

Acquisti očekává, že technologie rozpoznávání obličeje se bude v nadcházejících letech dále zlepšovat, a ptá se, co se stane, až bude považována za dostatečně dobrou, aby se jí po většinu času věřilo. Pro ty, kteří jsou špatně identifikováni, to může být noční můra. Není nic, co bychom jako jednotlivci mohli ovlivnit, říká.

Jiní výzkumníci zkoumají spolehlivost těžby sociálních dat. Na Defcon , hackerské konferenci v Las Vegas minulý víkend, skupina s názvem Online Privacy Foundation prezentoval své výsledky Experiment Velké pětky , studie, jejímž cílem bylo porovnat osobnostní rysy dobrovolníků s kvalitami na facebookových profilech. Po podání a osobnostní test dobrovolníkům vytěžili profily, aby identifikovali klíčové charakteristiky.

Výzkumníci nadace Online Privacy Foundation našli pozitivní korelaci mezi lidmi, jejichž osobnosti inklinovaly k otevřenosti, a těmi, jejichž profily na Facebooku byly nabité více informacemi: delší seznamy zájmů, delší životopisy a více diskuzí o penězích, náboženství, smrti a negativních emocích. Zjistili také pozitivní korelaci mezi příjemnými lidmi – definovanými jako soucitní, spolupracující, mající schopnost odpouštět a být pragmatický – a facebookovými statusy, které byly psány v delších větách, diskutovaly o pozitivních emocích nebo měly relativně více komentářů, přátel a fotky. V obou případech však byly korelace relativně slabé.

Výzkumníci došli k závěru, že profil na Facebooku je stěží spolehlivým zdrojem informací. Klíčovým bodem je zapamatovat si, že jde o sázku, říká spoluzakladatel nadace Chris Sumner . Zpráva zní, že ano, existuje odkaz, ale nepoužívejte jej samostatně pro kritická rozhodnutí.

Acquisti a Sumner říkají, že mohou být zapotřebí nové vládní politiky k ochraně jednotlivců před nadměrným dolováním dat a před zneužitím jejich informací. To by mohlo zahrnovat stanovení norem přesnosti, které by organizace měly dodržovat. Acquisti říká, že určující otázkou naší doby je, jak jako společnost nakládáme s velkými daty?

skrýt