Netbookové čipy vytvářejí cloud s nízkou spotřebou

Pomocí clusteru stejných procesorů, které se běžně objevují v netboocích a podobných mobilních zařízeních, vytvořili výzkumníci výkonnou serverovou architekturu, která spotřebovává méně energie než žárovka.





Malý zázrak: Každý uzel ve fast array of wimpy nodes (FAWN) má jeden 500megahertzový procesor AMD Geode, 256 MB RAM a jednu čtyřgigabajtovou kompaktní flash kartu. Největší dosud vybudovaný cluster FAWN se skládá z 21 uzlů.

Architektura, přezdívaná jako rychlé pole uzlů wimpy neboli FAWN, nabízí způsob, jak řádově snížit množství energie používané výpočetní infrastrukturou internetových gigantů, jako je Google, Microsoft, Amazon, eBay, Facebook a další. Pokud se potvrdí předpovědi jeho vynálezců, mohlo by to mít významný dopad jak na konečný výsledek, tak na dopad cloud computingu na životní prostředí.

Energie nyní tvoří až 50 procent nákladů na provoz datových center a ve Spojených státech se její cena za kilowatthodinu zvyšuje. Dokonce i relativně nováčci, jako je Facebook, spotřebují až 1 milion dolarů měsíčně na elektřinu a Agentura pro ochranu životního prostředí (EPA) předpokládá, že do roku 2011 by datová centra ve Spojených státech mohla spotřebovat až 100 miliard kilowatthodin elektřiny za celkový roční objem náklady ve výši 7,4 miliardy USD s odhadovaným dopadem na emise 59 milionů metrických tun CO².



FAWN, který je popsán v dosud nepublikovaném článku David Andersen a jeho tým na Carnegie Mellon University řeší tento problém kombinací relativně pomalých procesorů (druhu používaného v netboocích a jiných mobilních zařízeních) a flash paměti (druhu, který ukládá data v digitálních fotoaparátech a USB discích). Poněkud neintuitivním výsledkem je architektura, jejíž výkon na watt energie je stokrát lepší než u tradičních serverů, které využívají rychlejší (ale mnohem energeticky náročnější) procesory a disková úložiště.

Výjimečný výkon FAWN je omezen na určité druhy problémů – náhodný přístup k malým kouskům informací – ale tento druh úlohy náročné na vstup/výstup je přesně to, co zatěžuje stávající infrastrukturu webových společností, jako je Facebook.

Když přejdete na Facebook.com, domovská stránka obsahuje stovky jednotlivých datových prvků, které se převedou do stovek interních vyhledávání, říká Andersen. Požadavky na tyto stovky prvků, které zahrnují aktualizace přátel, počet zpráv v doručené poště a další, jsou předávány specializovanému softwaru, tzv. memcached , který ukládá relevantní data do paměti RAM. Memcached zabraňuje tomu, aby byly diskové databáze Facebooku zahlceny požární hadicí milionů současných požadavků na malé kusy informací. Amazon, který má se svým nákupním košíkem a vlastními doporučeními víceméně stejný problém jako Facebook, používá podobný software vytvořený na míru, nazvaný Dynamo, k provádění téměř stejné funkce.

Jedním ze způsobů, jak FAWN nahrazuje software jako memcached a Dynamo, je dobytí toho, co počítačoví vědci nazývají paměťová zeď, což je obrovský nepoměr mezi rychlostí, kterou disková úložiště mohou dodávat data do CPU, a rychlostí, jakou CPU, která je mnohem rychlejší, dokáže tato data prokousat. (Andersen poukazuje na to, že moderní CPU používají obrovské množství tranzistorů, které se snaží uhodnout, jaká data očekávat, načítají data předem nebo je ukládají do mezipaměti, aby se zajistilo, že čip má vždy stálý přísun bitů ke zpracování.)

Existují dva způsoby, jak obejít paměťovou zeď: první je zvýšit výkon systémové paměti a druhý je jednoduše zpomalit jeho CPU. FAWN dělá obojí: flash paměť má mnohem rychlejší náhodný přístup než disková úložiště a pomalejší procesory FAWN vyžadují méně energie a plýtvají méně tranzistory ve snaze odhadnout, co přijde dál.

FAWN se skládá z mnoha jednotlivých uzlů, z nichž každý má jeden 500megahertzový procesor AMD Geode (stejný čip, jaký byl použit v prvním notebooku One Laptop Per Child 100 $) s 256 MB RAM a jedinou čtyřgigabajtovou kompaktní flash kartou. Největší doposud postavený cluster FAWN sestávající z 21 uzlů spotřebovává v reálných podmínkách maximálně 85 wattů.

Každý uzel FAWN vykonává 364 dotazů za sekundu na watt, což je stokrát lépe, než může být dosaženo tradičním diskovým systémem pracujícím na úloze náročné na vstup/výstup, jako je shromažďování všech různorodých bitů informací potřebných k zobrazení. stránku Facebook nebo FriendFeed nebo výsledek vyhledávání Google.

Tento druh výkonu může mít aplikace mimo datové centrum, říká Steven Swanson , odborný asistent na katedře počítačových věd a inženýrství na Kalifornské univerzitě v San Diegu. Vlastní vysoce výkonný server Swanson založený na flash paměti s názvem Gordon, který v současné době existuje pouze jako simulace, je svou architekturou podobný FAWN, ale byl navržen s ohledem na vědecké aplikace i datová centra.

Cílem společnosti Swanson je využít jedinečné vlastnosti flash paměti k řešení problémů, které v současné době nelze řešit ničím jiným než nejvýkonnějšími a nejdražšími superpočítači na Zemi – systémy s až petabajtem RAM. Spolupracujeme se San Diego Supercomputing Center na velkých genomických a bioinformatických vzorcích, říká Swanson. Chceme provádět dotazy velmi rychle, a pokud se datové grafy nevejdou do paměti RAM, jsou velmi pomalé, což znamená, že se musíte vzdát věrnosti simulace.

FAWN je ten správný směr, kterým je třeba tlačit, říká Niraj Tolia , výzkumník v Exascale Computing Lab v HP Labs. Doby, kdy jsme se jednoduše dívali na hrubý výkon jako na metriku, jsou pryč, dodává.

V současné době není FAWN vhodný pro úlohy náročné na CPU, jako je zpracování videa, ale Andersen říká, že budoucí iterace budou používat výkonnější procesory Atom (o kterých Swanson také uvažuje pro svůj systém Gordon). Tyto výkonnější procesory byly navrženy pro netbooky a spotřebovávají stejné množství energie jako čipy AMD – každý asi čtyři watty. Přidejte napájecí zdroj a nějaké síťové vybavení a na jednom z těchto serverů byste mohli velmi snadno provozovat malou webovou stránku, která by spotřebovala 10 wattů, říká Andersen – desetinu toho, co spotřebovává typický webový server.

Další generace FAWN je něco, co Andersen doufá, že největší uživatelé datových center prozkoumají. Byl bych rád, kdyby se nám podařilo přimět Facebook, Google nebo Microsoft, aby s tím začaly budovat clustery, říká.

skrýt