Jak bojovat proti nenávisti online

Datová vědkyně Jennifer Chayes si myslí, že můžeme použít výpočetní nástroje k odstranění špatného chování online.





27. října 2021 Jennifer Chayesová

Christie There Klok

Během svého působení v Microsoftu a na akademické půdě Jennifer Chayes bojovala za využití datové vědy a výpočetní techniky, aby byla umělá inteligence spravedlivější a méně zaujatá.

Od ukončení školy ve věku 15 let až po to, že se stal doyenem datové vědy na Kalifornské univerzitě v Berkeley, prošel Chayes poměrně dlouhou kariérou. Na UCLA nastoupila v roce 1987 jako profesorka matematiky. O deset let později ji Microsoft zlákal, aby spoluzaložila svou interdisciplinární skupinu Research Theory Group.



Problém s výpočetní technikou

Tento příběh byl součástí našeho vydání z listopadu 2021

  • Viz zbytek čísla
  • předplatit

Právě v její laboratoři Microsoftu v New Yorku výzkumníci objevili zaujatost ve firemním softwaru pro rozpoznávání obličejů, což ukazuje, že systém klasifikoval bílé tváře přesněji než hnědé a černé tváře. Toto zjištění způsobilo, že společnost odmítla lukrativní smlouvu s policejním oddělením a začala pracovat na odstranění zkreslení takových algoritmů. The Skupina FATE (Fairness, Accountability, Transparency and Ethics in AI). byl vytvořen v laboratoři.

Anil Ananthaswamy zeptal se Chayese, nyní přidruženého probošta Divize výpočetní techniky, datové vědy a společnosti a děkana School of Information v Berkeley, jak datová věda transformuje výpočetní techniku ​​a další obory.



Otázka: Jaké to bylo přejít z akademické sféry do průmyslu?

A: To byl docela šok. Viceprezident výzkumu společnosti Microsoft, Dan Ling, mi zavolal, aby se mě pokusil přesvědčit, abych šel na pohovor. Mluvil jsem s ním asi 40 minut. A nakonec jsem řekl: Opravdu chceš vědět, co mě trápí? Microsoft je parta dospívajících kluků a já nechci strávit svůj život s partou dospívajících kluků.

Q: Jak na to reagoval?



A: Řekl: Ne, nejsme. Přijďte se s námi seznámit. Při své návštěvě jsem tam potkal několik neuvěřitelných žen a potkal jsem fenomenálně otevřené lidi, kteří chtěli vyzkoušet věci, které změní svět.

Otázka: Jak změnila datová věda výpočetní techniku?

NA: Jak jsme získali více dat, informatika se začala dívat ven. O datové vědě přemýšlím jako o spojení výpočetní techniky, statistiky, etiky a důrazu na doménu nebo disciplinárního důrazu, ať už jde o biomedicínu a zdraví, klima a udržitelnost nebo lidský blahobyt a sociální spravedlnost a tak dále. Transformuje výpočetní techniku.



Otázka: Je rozdíl v tom, jak datoví vědci řeší problémy?

Odpověď: S příchodem všech těchto dat máme možnost učit se z dat, aniž bychom měli teorii, proč se něco děje. Zejména v tomto věku strojového učení a hlubokého učení nám umožňuje vyvozovat závěry a předpovídat bez základní teorie.

Otázka: Může to způsobit problémy?

NA: Někteří to považují za problém v případech, kdy máte [například] biomedicínská data. Data velmi přesně předpovídají, co bude fungovat a co nebude fungovat, bez základního biologického mechanismu.

Q: Nějaké výhody?

NA: Data nám nyní v mnoha případech umožnila spustit to, co by ekonom nazval kontrafaktuální, kde ve skutečnosti vidíte náhodné variace v datech, které vám umožňují vyvodit závěry, aniž byste museli provádět experimenty. To je neuvěřitelně užitečné.

Opravdu chci vyzkoušet různá vzdělávání na různých populacích? Nebo chci vidět, [že] v určitém okamžiku došlo k náhodným variacím, které mi umožní vyvodit opravdu dobrý kauzální závěr, a proto na tom mohu založit politiku?

Otázka: Vidíte problém v tom, jak jsou data využívána, zejména velkými společnostmi?

A: Problémů je nespočet. Nevyužívají jej pouze technologické korporace. Používají ho pojišťovny. Používají ho vládní platformy, platformy veřejného zdraví a vzdělávací platformy. Pokud explicitně nerozumíte tomu, jaké zkreslení se může vkrádat, a to jak v samotných souborech dat, tak v algoritmech, pravděpodobně zkreslení ještě zhoršíte.

Tyto předsudky se vkradou [když] není mnoho dat. A také to může korelovat s dalšími faktory. Osobně jsem pracoval na automatickém výkladu bios a životopisů. Nesmíme používat pohlaví nebo rasu. I když se nedívám na [tyto] chráněné atributy, existuje mnoho věcí [v datech], které jsou zástupnými znaky pohlaví nebo rasy. Pokud jste chodili do určitých škol, pokud jste vyrostli v určitých čtvrtích, pokud jste hráli určité sporty a měli jste určité aktivity, souvisí to [s pohlavím nebo rasou].

Otázka: Zachytí algoritmy tyto proxy?

NA: Zhoršují to. Musíte tomu výslovně rozumět a musíte tomu výslovně zabránit při psaní algoritmu.

Otázka: Jak můžeme takové problémy řešit?

NA: Existuje celá tato oblast FATE: spravedlnost, odpovědnost, transparentnost a etika v AI, což je návrh těchto algoritmů a pochopení toho, co jsou. Ale je toho mnohem víc, co musíme udělat.

Q: A datová věda pomáhá?

A: Tohle je absolutně datová věda. Existuje část sítě zvaná manosféra, kde vzniká spousta nenávisti. Je to trochu těžké vysledovat. Pokud ale použijete zpracování v přirozeném jazyce a další nástroje, můžete vidět, odkud to pochází. Můžete se také pokusit vytvořit rozhraní, která umožní zájmovým skupinám a dalším, aby to našli a pomohli to vykořenit. To jde nad rámec toho, že je to spravedlivé. To obrací karty na způsob, jakým byly tyto platformy uzurpovány za účelem zvýšení zaujatosti a nenávisti, a říká: Využijeme sílu výpočetní techniky a datové vědy k identifikaci a zmírnění nenávisti.

skrýt