211service.com
Jak se výpočetní technika proměnila
Jeanette Wing věří, že důvěryhodná umělá inteligence a kauzální uvažování mohou společnosti pomoci vyřešit problémy skutečného světa. Ale nebude to jednoduché.
27. října 2021
Peter Garritano
Je čas, abychom se začali soustředit na data, abychom vyřešili naše problémy, říká jeden z předních světových odborníků na datovou vědu.
V roce 2006 Jeannette Wing, tehdejší vedoucí katedry informatiky na Carnegie Mellon University, zveřejnila vlivnou esej s názvem Počítačové myšlení, argumentovat, že každý by těžil z používání koncepčních nástrojů informatiky k řešení problémů ve všech oblastech lidského snažení.
Tento příběh byl součástí našeho vydání z listopadu 2021
- Viz zbytek čísla
- předplatit
Sama Wing nikdy neměla v úmyslu studovat informatiku. V polovině 70. let vstoupila na MIT, aby se věnovala elektrotechnice, inspirovaná svým otcem, profesorem v tomto oboru. Když objevila svůj zájem o informatiku, zavolala mu, aby se zeptala, zda je to přechodná móda. Obor ostatně neměl ani učebnice. Ujistil ji, že ne. Wing změnil hlavní obory a nikdy se neohlédl.
Wing, dříve podnikový viceprezident pro výzkum společnosti Microsoft a nyní výkonný viceprezident pro výzkum na Kolumbijské univerzitě, je lídrem v propagaci datové vědy v mnoha oborech.
Anil Ananthaswamy nedávno se Wing zeptala na její ambiciózní program propagace důvěryhodné umělé inteligence, jedné z nich 10 výzkumných výzev identifikovala se ve své snaze učinit systémy umělé inteligence spravedlivějšími a méně zaujatými.
Otázka: Řekl byste, že probíhá transformace ve způsobu, jakým se provádí výpočty?
A: Rozhodně. Moorův zákon nás zavedl dlouhou cestu. Věděli jsme, že u Moorova zákona narazíme na strop, takže do popředí se dostaly paralelní výpočty. Ale fázovým posunem byl cloud computing. Původní distribuované souborové systémy byly jakýmsi dětským cloud computingem, kde vaše soubory nebyly lokální na vašem počítači; byli někde jinde na serveru. Cloud computing to bere a ještě více zesiluje tam, kde data nejsou blízko vás; výpočet není blízko vás.
Další posun je o datech. Nejdelší dobu jsme se zaměřovali na cykly, díky kterým věci fungovaly rychleji – procesory, CPU, GPU a další paralelní servery. Ignorovali jsme datovou část. Nyní se musíme zaměřit na data.
Otázka: To je doména datové vědy. Jak byste to definoval? Jaké jsou problémy s používáním dat?
NA: Mám velmi stručnou definici. Datová věda je studium získávání hodnoty z dat.
Nemůžete mi dát jen hromadu nezpracovaných dat a já zmáčknu tlačítko a hodnota vyjde. Začíná se sběrem, zpracováním, ukládáním, správou, analýzou a vizualizací dat a následnou interpretací výsledků. Říkám tomu životní cyklus dat. Každý krok v tomto cyklu je hodně práce.
Otázka: Když používáte velká data, často se objevují obavy o soukromí, zabezpečení, spravedlnost a zaujatost. Jak lze tyto problémy řešit, zejména v AI?
NA: Mám tuto novou výzkumnou agendu, kterou propaguji. Říkám tomu důvěryhodná AI, inspirovaná desetiletími pokroku, kterého jsme dosáhli v oblasti důvěryhodných počítačů. Důvěryhodností obvykle rozumíme bezpečnost, spolehlivost, dostupnost, soukromí a použitelnost. Za poslední dvě desetiletí jsme udělali velký pokrok. Máme formální metody, které mohou zajistit správnost části kódu; máme bezpečnostní protokoly, které zvyšují bezpečnost konkrétního systému. A máme určité představy o soukromí, které jsou formalizované.
Důvěryhodná AI zvyšuje ante dvěma způsoby. Najednou mluvíme o robustnosti a férovosti – robustnost znamená, že pokud narušíte vstup, výstup není příliš narušen. A to mluvíme o interpretaci. To jsou věci, o kterých jsme nikdy nemluvili, když jsme mluvili o počítačích.
[Také] Systémy umělé inteligence mají pravděpodobnostní povahu. Výpočetní systémy minulosti jsou v podstatě deterministické stroje: jsou zapnuté nebo vypnuté, pravdivé nebo nepravdivé, ano nebo ne, 0 nebo jeden . Výstupy našich systémů AI jsou v podstatě pravděpodobnosti. Když vám řeknu, že váš rentgen říká, že máte rakovinu, je to s pravděpodobností 0,75, že ta malá bílá skvrna, kterou jsem viděl, je maligní.
Takže teď musíme žít v tomto světě pravděpodobností. Z matematického hlediska to používá pravděpodobnostní logiku a přináší spoustu statistik a stochastických úvah a tak dále. Jako počítačový vědec nejste trénováni myslet tímto způsobem. Takže systémy umělé inteligence skutečně zkomplikovaly naše formální uvažování o těchto systémech.
Otázka: Důvěryhodná AI je jednou z 10 výzkumných výzev identifikovali jste pro datové vědce. Kauzalita se zdá být další velkou věcí.
A: Myslím, že kauzalita je další hranicí pro AI a strojové učení. Právě teď jsou algoritmy a modely strojového učení dobré při hledání vzorců a korelací a asociací. Ale nemohou nám říct: Způsobilo to tohle? Nebo kdybych to udělal, co by se stalo? A tak je tu další celá oblast činnosti v oblasti kauzálního vyvozování a kauzálního uvažování v informatice. Komunita statistik se zabývá kauzalitou po celá desetiletí. Někdy jsou trochu naštvaní na počítačovou komunitu, když si myslí, že Oh, to je zbrusu nový nápad. Takže chci poděkovat statistické komunitě za jejich zásadní přínos ke kauzalitě. Kombinace velkých dat a kauzálního uvažování může skutečně posunout obor kupředu.
Otázka: Jste nadšeni z toho, čeho může datová věda dosáhnout?
NA: Všichni si pohrávají s datovou vědou, protože vidí, jak se jejich pole proměňují používáním metod datové vědy na digitálních datech, která nyní generují, produkují, shromažďují a tak dále. Je to velmi vzrušující doba.
