211service.com
E-maily The Immortal Life of the Enron
Bývalý výkonný ředitel Enronu Vincent Kaminski je skromný, částečně v důchodu profesor obchodní školy z Houstonu, který nedávno napsal 960stránková kniha vysvětlovat základy energetických trhů. Jeho nejtrvalejší dědictví však může zahrnovat tisíce e-mailů, které napsal před více než deseti lety ve společnosti energetických služeb.

Firemní korpus : Svazky e-mailů, které byly odeslány a přijaty v ústředí Enronu v Houstonu, zde v roce 2002, jsou stále analyzovány a pitvány počítačovými vědci a dalšími výzkumníky.
Kaminski, bývalý výkonný ředitel pro výzkum, který opakovaně varovali před praktikami viděl v Enronu, je mezi více než 150 vedoucími pracovníky, jejichž e-mailové schránky byly vyhozeny na internet Federální energetickou regulační komisí (FERC) 26. března 2003. Ve jménu služby zájmu veřejnosti během vyšetřování Enronu , federální agentura učinila kontroverzní rozhodnutí zveřejnit online více než 1,6 milionu e-mailů, které vedoucí pracovníci Enronu odeslali a přijali od roku 2000 do roku 2002. FERC se nakonec po obdržení stížností pokusil odstranit nejcitlivější a nejosobnější údaje ( viz PDF ). I tak zůstává e-mailový korpus Enron, jak je nyní očištěná verze známá, největší veřejnou databází skutečných e-mailů na světě – zdaleka.
Tento korpus je cenný pro počítačové vědce a teoretiky sociálních sítí způsobem, který autoři a příjemci e-mailů nikdy nezamýšleli. Protože je to bohatý příklad toho, jak skuteční lidé ve skutečné organizaci používají e-mail – plný všedních obědových plánů, nudných poznámek ze schůzek, trapných flirtů, které odhalily alespoň jeden mimomanželský poměr, a usvědčujících dopisů, které vysvětlovaly korupci – stát se základem stovek výzkumných studií v tak rozmanitých oblastech, jako je strojové učení a genderová studia na pracovišti.
Tento výzkum má široké uplatnění: počítačoví vědci korpus použili k trénování systémů, které automaticky upřednostňují určité zprávy ve schránce a upozorňují uživatele, že možná zapomněli na důležitou zprávu. Jiní výzkumníci používají korpus Enron k vývoji systémů, které automaticky organizují nebo shrnují zprávy. Velká část dnešního softwaru pro odhalování podvodů, protiteroristické operace a těžba vzorců chování na pracovišti přes e-mail byla nějakým způsobem ovlivněna souborem dat.
Je to jako bychom studovali kvasinky, říká William Cohen, počítačový vědec z Carnegie Mellon University, který pomohl dát korpus do databáze, kterou by mohli výzkumníci těžit. Je studován a experimentován, protože je to velmi dobře pochopený modelový organismus. [E-mail generovaný] Enronem je podobný. Lidé jej budou používat ještě dlouhou dobu.
E-maily Enronu prodloužily životnost vědci z MIT, Carnegie Mellon University a neziskového výzkumného institutu SRI International. Před deseti lety výzkumníci z těchto institucí spolupracovali na projektu CALO financovaném agenturou DARPA, což je zkratka pro Kognitivní asistent, který se učí a organizuje, a jehož největší sláva dala vzniknout softwaru Siri společnosti Apple. Pro CALO výzkumníci spojili mnohem menší e-mailové datové soubory k analýze.
Když byly e-maily Enronu v roce 2003 zveřejněny, vědci si uvědomili, že by mohly být extrémně užitečné pro testování algoritmů, které dokážou zpracovat psaný jazyk a tvoří základ inteligentních pracovních nástrojů. Protože FERC poslal e-maily v nepoužitelném formátu, MIT Leslie Kaelbling zakoupili nezpracované soubory od vládního dodavatele za 10 000 dolarů a jiní trávili čas čištěním dat – odstraňováním duplikátů, organizováním složek, vyjímáním zbývajících soukromých příloh a e-mailů a mapováním odesílatelů a příjemců na organizační strukturu Enronu. Korpus, nejprve více než 517 431 e-mailů, byl zmenšil na 200 000 do roku 2004.
Kolem korpusu stále kvete výzkumný ekosystém, protože nic podobného ve veřejné doméně neexistuje. Pokud by neexistoval, výzkum obchodních e-mailů by mohli provádět pouze lidé s přístupem k velkým firemním nebo vládním serverům. To by pravděpodobně vylučovalo výzkumníky v oblasti sociálních věd, organizace a lingvistiky – mnozí z nich korpus využili k získání cenných poznatků o firemní kultuře, říká Owen Rambow, profesor Kolumbijské univerzity zapojený do výzkumného projektu, který používal korpus Enron a získal Grant 510 000 $ od National Science Foundation .
Od roku 2010 asi 30 článků ročně cituje původní článek, který prezentoval korpus Enron, odhaduje Carnegie Mellon's Cohen. Letos např. výzkumníci z HP Labs obrátil se na korpus, aby předvedl program umělé inteligence pro automatickou identifikaci závazků, které lidé uzavírají prostřednictvím e-mailu. Jafar Adibi, který pracoval na an raná mapa sociální sítě Enron , říká, že stále dostává hrstky dotazů každý měsíc, stále více od výzkumníků mimo Spojené státy. Stále existuje aktivní seznam-serv věnované diskuzi o korpusu.
Výzkumníci, kteří pracovali s korpusem, vědí, že žádný další Enron nebude. Společnost FERC zveřejnila e-maily v době, kdy se svět měl ještě hodně co učit o online soukromí. Zmíněné škody na lidech – z nichž většina byla v Enronu nevinná v jakémkoli provinění – byly rychle zjevné. Byla tam čísla sociálního pojištění a dokonce i bankovní záznamy. Přestože bylo odstraněno mnoho soukromých dat, při procházení stovek e-mailů v Kaminskiho složce odeslaných jsem našel telefonní číslo domů, jméno jeho manželky a nelichotivý názor, který měl na bývalého kolegu. Také jsem měl pocit, že už dlouho, dlouho čekal na povýšení, které obdržel v roce 2000. V době, kdy byly e-maily poprvé zveřejněny, Kaminski, manažer asi 50 zaměstnanců společnosti Enron, řekl, že ho nejvíc znepokojilo, když viděl jeho zpětná komunikace o stížnostech v oblasti lidských zdrojů a hodnocení uchazečů o zaměstnání se stává veřejným. Uchazeč o zaměstnání, se kterým jednou dělal pohovor, se po propuštění rozčílil.
Dnes se mnoho lidí, kteří pracují ve vysoce regulovaných odvětvích, jako jsou finance, vyhýbá uvádění citlivých informací do svých e-mailů. Kaminski, který později sloužil jako výkonný ředitel v Citigroup, poznamenává, že zkratka LTOL se v letech následujících po Enronu stala populárním e-mailovým žargonem. Je to zkratka Let’s take this offline.