211service.com
Nejžhavější počítačová laboratoř na světě
Napůl světa daleko od klidné krásy Seattlu a Puget Soundu je laboratoř, kde se plní softwarové sny. Ve společnosti Microsoft Research Asia je snaha o úspěch stejně intenzivní jako provoz, který hučí u předních dveří v nespoutané, chaotické zuřivosti. Pokud se ostatní zařízení společnosti Microsoft po celém světě zdají idylické, toto v Pekingu v Číně je čistá ulice. Nedaleké výškové budovy soutěží s komíny o nadvládu nad panoramatem. Zchátralé budovy stojí vedle rušných trhů se spotřební elektronikou a Beijing Satellite Manufacturing Factory, kde Čína provádí výzkum vesmírných letů. Mantra Microsoftu: tvrdě pracujte, abyste se dostali do dveří; pracovat tvrději, abyste přežili; pak pracujte ještě usilovněji, protože skutečná práce – ta světového lídra v oblasti informačních technologií – teprve začíná.
Pokud je pro vás těžké fandit Microsoftu, nikdy jste se nesetkali s Harrym Shumem. Výkonný ředitel pekingské laboratoře je srdečný, poutavý a překvapivě mladý – je mu 30 let. Toto je nový druh výroby v Číně, říká a s úsměvem čeká před svou kanceláří. Nejen boty, ponožky, dětské kočárky. Nyní vyrábíme studenty, dokumenty a software MIT. Shumův dlouholetý kolega Hongjiang Zhang jde kolem, ale zastaví se, aby souhlasil: Je to další úroveň Made in China,“ říká. Zhang, který je o něco starší než Shum a rezervovanější, vede Laboratoř Advanced Technology Center, divizi spuštěnou koncem minulého roku, aby urychlila nové technologie do produktového portfolia společnosti Microsoft.
Shum a Zhang společně vedou organizaci, která vypadá jako typická firemní laboratoř, ale cítí jako startup. Přes všechny své kabiny a počítače překypuje laboratoř nadšením; jeho energie pochází především od studentů. Přijďte v kteroukoli hodinu a najdete jich desítky – laboratoř kdykoli podporuje asi 200 stážistů, většinou z místních univerzit – kteří pracují na projektech, na které společně dohlížejí manažeři Microsoftu. Přidejte bzučení mandarínských konverzací, výhledy z okna na rozlehlý Peking a všudypřítomný náznak cigaretového kouře a budete si neustále připomínat: už nejste v korporátních USA.
Přestože vedou laboratoř, Shum a Zhang jsou stále v srdci výzkumníci. Pohybují se nahoru a dolů v rozlehlých uličkách pracovních stanic a předvádějí svá nejnovější dema jako hrdí rodiče. Shum se zastaví u stolu mladé ženy, kterou nazývá studentkou číslo jedna v informatice na Tsinghua University, jedné z nejlepších čínských inženýrských škol. Na její obrazovce jsou stále fotky vodopádu, deště na jezeře a stébla trávy.
Jediným kliknutím myši scény ožijí. Voda se valí a šplouchá přes vodopády, kapky deště padají na povrch a tráva se vlní ve vánku. Počítač generuje animaci na místě: software vyhledal ve videích statistické vodítka o tom, jak se voda a tráva pohybují, a aplikoval lekce na statické obrázky.
To vše je součástí ambice laboratoře stát se světovou jedničkou ve vytváření interaktivních, zábavných a nakonec užitečnějších počítačů. Mezi další ukázky patří kompresní algoritmy, které ukládají bohaté obrázky pomocí relativně malého počtu digitálních bitů; Software pro počítačové vidění, který sleduje a rozpoznává lidské tváře; přirozeně znějící syntetizér řeči; a uživatelská rozhraní, která digitálně zachycují rukopis (vidět Kouzelné pero od Microsoftu , DĚTI květen 2004) . Dělají opravdu prvotřídní výzkum, říká Victor Zue, spoluředitel Laboratoře výpočetní techniky a umělé inteligence MIT a člen technického poradního výboru pekingské laboratoře. A Raj Reddy, uznávaný odborník na interakci mezi člověkem a počítačem na Carnegie Mellon University, nazývá vedení laboratoře a zásobu talentů vynikajícími.
Se 150 výzkumnými pracovníky na plný úvazek a více než 80 miliony dolarů od své mateřské společnosti od otevření v roce 1998 se Microsoft Research Asia stal hybnou silou výzkumu a vývoje v oblasti informačních technologií. Pekingská výzkumná základna ovlivňuje globální podnikání společnosti mnohem rychleji, než očekávali dokonce i nejlepší představitelé společnosti Microsoft. Více než 70 technologií, které vyvinula, se již používá v produktech společnosti Microsoft, včetně softwaru pro operační systémy Windows a grafických balíčků pro videohry Xbox. Více nejnovějšího softwaru laboratoře je naplánováno pro další verzi Windows (s kódovým označením Longhorn), která má vyjít v roce 2006.
Pekingská laboratoř je klíčovou součástí snahy společnosti Microsoft zajistit svou globální budoucnost prostřednictvím výzkumu. Je zajímavé, jak velká část výzkumu zaměřeného na asijské tržiště se ukázala být obecně použitelná, říká Rick Rashid, senior viceprezident společnosti Microsoft Research, která kromě svého hlavního zařízení v Redmondu ve státě WA provozuje také laboratoře v San Franciscu, Mountain View, CA a Cambridge, Anglie. Často zaútočí na problém jinak, než by se stalo v Evropě nebo USA, protože přicházejí z jiné perspektivy. Často najdou řešení, která jsou odlišná, a v některých případech se odlišná ukáže být lepší.
Takže Bill Gates přišel na Čínu? Předseda Microsoftu nezašel tak daleko a jeho společnost není jediným infotech gigantem, který otevřel výzkumnou laboratoř v Číně (viz Další americké podnikové informační technologie v Číně níže). Ale rozsvítí se, když se řeč stočí k jeho pekingské bonanze. Když založíte laboratoř, měli byste říct: Dobře, za pět let chceme, abyste přispěli,' řekl Gates. Recenze technologie . Tihle kluci – devět měsíců poté, co začali – měli tyto výsledky komprese videa. Tyto druhy výsledků již odlišují laboratoř Microsoftu od jejích konkurentů, což z ní dělá případovou studii globálních inovací. Lidé by měli Číně věnovat pozornost, říká Gates. Je to fenomén v každém ohledu.
| DALŠÍ AMERICKÉ FIREMNÍ INFOTECH LABS V ČÍNĚ | |||
| Organizace | Založeno | Město | Vynikající technologie |
| IBM China Research Laboratory | devatenáct devadesát pět | Peking | Řečová rozhraní pro telefony, strojový překlad, mobilní zařízení, e-commerce |
| Intel China Research Center | 1998 | Peking | Rozpoznávání řeči s vizuálními podněty, strojový překlad, strojové učení, pokročilé softwarové kompilátory |
| Bell Labs Research China | 2000 | Peking | Datové sítě, komunikace, optika |
| Čínské výzkumné centrum Motorola | 2000 | Šanghaj | Rozpoznávání řeči a rukopisu, zpracování přirozeného jazyka, zpracování dat na internetu |
Bestie z východu
Harry Shum má hlad. Celá jeho laboratoř má hlad. Během oběda s nudlemi a rybami ve své pekingské kanceláři Shum vysvětluje, co žene jeho zaměstnance. Začali jsme z ničeho. Z této místnosti vyrostla celá laboratoř. Takže nic nepředělávám, vtipkuje, jako by na feng shui záleželo největší světové softwarové společnosti. Ale ještě před deseti lety byla oblast kolem laboratoře zemědělská půda. Microsoft Research Asia dnes zabírá jeden a půl velkého patra v šestipatrové kancelářské budově s futuristickou prosklenou vstupní halou. Laboratoř začala symbolizovat město uprostřed high-tech revoluce.
Shum sám je živým mixem východu a západu. Jeho angličtina je s přízvukem, ale velmi jasná. Narodil se a vyrůstal poblíž Šanghaje, svou postgraduální práci absolvoval na Carnegie Mellon University (říká, že je stále zarputilým fanouškem Pittsburgh Steelers) a v roce 1996 nastoupil do Microsoft Research v Redmondu. Tam se stal jednou z vycházejících hvězd společnosti a vytvořil realistické 3D grafika a virtuální prostředí využívající principy vypůjčené z počítačového vidění.
O dva roky později přišla příležitost: Microsoft zakládal laboratoř v Číně. Cílem bylo využít obrovské množství talentů studentů a vědců v zemi, včetně mnoha, kteří emigrovali do jiných zemí, ale mohli být zlákáni zpět do své rodné země. A být v pozici prozkoumat trh s miliardou lidí v rychle se industrializující ekonomice také nemůže ublížit. Do vedení společnosti Microsoft přizval Kai-Fu Lee, známého odborníka na řeč a multimédia z Apple Computer a Silicon Graphics. . Shum si ten den dobře pamatuje. Kai-Fu přišel do mé kanceláře a řekl: Stěhuji se do Pekingu a bez tebe neodejdu,“ říká.
Grafičtí obři
Baining Guo chce méně řečí a více akce. Guo, bývalý výzkumník Intelu a nyní manažer grafického výzkumu Microsoft Research Asia, nesedí u rozhovorů. Nemluví. Ať už je konečným produktem videohra, spořič obrazovky nebo personalizovaná karikatura vykreslená z fotografie, říká, že grafika je prvořadá záležitost: buď vypadá dobře, nebo ne. Jeho skupinu tvoří 12 výzkumných pracovníků a v současnosti 18 studentů; aby prozkoumal jejich nejnovější výsledky, prochází chodbou na otevřenou plochu, kde všichni pracují.
Naléhavým problémem v grafice – jedné z výjimečných oblastí laboratoře – je přimět počítače, aby animovaly fotorealistické lidské tváře. V dnešních videohrách vypadají výrazy postav falešně, říká Guo. Jejich tváře se nepohybují věrohodně ani přirozeně. Je to těžký problém, například dosáhnout správného vzhledu vrásek kolem očí a čela pomocí konvenčních technik, které jednoduše morfují a roztahují rysy obrázku.
Guoův tým předvádí špičkové řešení. Nejprve pořídí asi deset statických snímků mužského obličeje, z nichž každý zachycuje jiný výraz: zvednuté obočí, skrčený nos, smích, grimasy a tak dále. Poté rozdělením obličeje do 14 oblastí a více než 100 funkčními body – víčka, konečky obočí, koutky rtů – jejich software míchá různé kombinace fotografií a vytváří přirozenější simulace nových výrazů. Software také moduluje obraz z jednoho výrazu do druhého během několika sekund. Výsledek: mužská tvář se změní od překvapeného k realistickému znechucení, vrásky a tak.
Na rozdíl od technik používaných v počítačově animovaných filmech jako např Příběh hraček , přístup pekingských vědců nevyžaduje žádné ruční kreslení rámečků. To znamená, že by mohl být použit ve videohře ke generování realisticky vypadajících tváří za běhu. S nějakou další konfigurací by také mohl mapovat výrazy z obličeje uživatele na virtuální postavu a vytvořit tak personalizovaného avatara pro hru na hrdiny. A co víc, fotky celebrit mohou být animované nebo reanimované. Mohli bychom přimět Alberta Einsteina, aby řekl: „Miluji Windows,“ řekl Guo. Jeho tým však sleduje vyšší cíl, který by mohl v konečném důsledku transformovat tvorbu filmů: software, který generuje fotorealistické virtuální herce v reálném čase.
Tento druh závazku k fundamentálnějšímu počítačovému výzkumu si laboratoř vysloužila respekt akademické komunity. Microsoft Research je zdaleka největším přispěvatelem do grafiky v podnikovém světě. Je to síla, říká Paul Debevec, odborník na grafiku z Institutu kreativních technologií na University of Southern California. Zejména pekingská laboratoř dosáhla úžasných výsledků, dodává. Nejde jen o to, jak můžeme udělat lepší Xbox?‘
Ale ve skutečnosti je lepší Xbox součástí poslání laboratoře. Připomenutí, že se jedná o obchod, nikoli hřiště pro výzkumníky, nejsou nikdy daleko. V přilehlé chodbě má velká rohová místnost okna polepená neprůhlednými listy papíru. Nápis na zamčených dveřích hlásá, Xbox: Confidential. Guo nesmí mluvit o tom, co se děje uvnitř. Někteří z našich nejlepších lidí tam pracují, to je vše, co řekne.
Mistři multimédií
Eric Chang je sultán řeči. Mluví rychle, klade spoustu otázek a zdá se, že ví, co řeknete, než to řeknete. Zpočátku je to trochu znervózňující, ale vzhledem k jeho postgraduálnímu výcviku v rozpoznávání řeči na MIT to dává smysl. A protože počítačové klávesnice mají potíže s přizpůsobením se asijským jazykům – tisícům znaků, na rozdíl od několika desítek písmen – součástí motivace pro Changovu řečovou skupinu v Pekingu je vyvinout lepší rozhraní pro asijské uživatele. Systémy založené na řeči jsou součástí plánu společnosti Microsoft, který pro začátek umožní legiím Číňanů efektivněji přistupovat k informacím a komunikovat.
Chang vejde do kanceláře mladé výzkumnice Min Chu a požádá ji, aby spustila ukázku převodu textu na řeč. Chu píše větu v čínštině, ale posype jimi anglickými slovy, jak je běžné v technických pasážích a diskuzích. Po několika sekundách počítač vygeneruje přirozeně znějící ženský hlas, který zní dokonale dvojjazyčně, když opakuje napsanou větu přes reproduktory na ploše.
Trik je v tom, aby skloňování, načasování a přechody od slova ke slovu zněly správně – a ne jako robotický monotón. Na rozdíl od jiných syntetizérů řeči rozděluje software Chang and Chu text na různě velké kusy – fonémy, slabiky nebo celá slova – a používá databázi více než 10 000 mluvených vět k výběru a poskládání správných zvuků. Tento dvojjazyčný syntezátor je skutečně hlavou a rameny nad vším, co jsem slyšel, říká Zue z MIT, odborník na systémy mluveného jazyka.
Je to příklad toho, jak kulturní perspektiva laboratoře byla nápomocná při řešení problémů. Prvním cílem projektu bylo vytvořit mandarínský syntezátor řeči pro čínský trh. V roce 2001 jsme měli první recenzi Billa G., říká Chang. Řekl: To je dobré, ale nerozumím čínštině.‘ Tato reakce předsedy Microsoftu motivovala Changovu skupinu, aby použila stejné matematické modely na angličtinu. Protože v mandarínštině tolik záleží na výšce – jemná změna tónu je jediné, co odlišuje slovo pro matku od slova pro koně –, systém byl schopen lépe zachytit skloňování angličtiny a dalších jazyků. Očekávejte, že tento software pro syntézu hlasu uvidíte na trhu v příštích několika letech, říká Chang, který se nedávno stal asistentem generálního ředitele laboratoře Advanced Technology Center.
Pekingská laboratoř také pomáhá Microsoftu porozumět asijskému trhu v bezprostřednějších spotřebitelských oblastech, jako je multimediální komunikace přes mobilní zařízení. Jen v Číně je již více než 240 milionů uživatelů mobilních telefonů. Mají tendenci aktualizovat své služby častěji než uživatelé v USA a obecně se více zajímají o gadgety, říká Shipeng Li, vedoucí skupiny internetových médií v laboratoři a další bývalý výzkumník Sarnoff. Tady je to jako v módě, říká.
Stylově ležérní Li nosí džíny a působí uvolněněji než ostatní výzkumníci. Jeho skupina je o hladkém videu, to jest. V další místnosti jeden z 20 studentů Li připravil ukázku jednoho z prvních videokonferenčních systémů na světě, který běží na kapesním počítači. Student zvedne kapesní počítač – ve kterém je umístěna videokamera, mikrofon, bezdrátové spojení a software pro datovou komunikaci – a mluví do něj. Jeho tvář se ukazuje na obrazovce nedalekého stolního počítače, který je podobně vybavený. Video je kódováno rychlostí 10 snímků za sekundu, což je dost na to, aby vypadalo docela plynule, se zpožděním zvuku asi půl sekundy, když vědci mluví tam a zpět. Ačkoli je kvalita nižší než u běžného videa, říká Li, je stále mnohem vyšší než u stávajících kapesních technologií.
Klíčový pokrok: software běžící na počítači každého uživatele monitoruje podmínky datového kanálu, bere v úvahu, jaké druhy zařízení se používají, a efektivně komprimuje tok videa, takže je třeba odesílat méně bitů. Asi 50 000 uživatelů si stáhlo nejnovější prototypovou verzi softwaru z webu společnosti Microsoft. Pokud se podaří zkrátit přenosová zpoždění, řekl Li, měly by se ruční videotelefony na asijském trhu prosadit do tří let.
Existují však i aplikace na kratší dobu. Stahujte multimediální soubory z webu. Výzkumníci z Liho skupiny vyvíjejí způsoby, jak kódovat video, aby jej bylo možné odeslat na vaši plochu bez přestávek, přeskakování a zasekávání, které jsou u dnešních internetových odkazů příliš běžné. Liův systém to dělá tak, že se přizpůsobí podmínkám datového připojení.
Li používá jednoduchou analogii k vysvětlení pokroku Microsoftu. Představte si mediální obsah jako náklad k přepravě, říká. Namísto dnešní strategie posílat to v jednom velkém náklaďáku, který může uvíznout v dopravní zácpě, ho Liův tým posílá po částech v menších vozidlech, přičemž dává vyšší prioritu těm kouskům, které byly předem označeny jako obzvláště důležité. I když se některé kousky zaseknou nebo ztratí, v průměru projdou ty nejdůležitější – ty, které popisují základní strukturu obrazu a způsob, jakým se mění.
Konečným výsledkem je plynulejší a spolehlivější stahování videa. Pomocí této technologie Li přehrává video zpěvačky Christiny Aguilery; hned vedle něj přehraje stejné video na aktuálním přehrávači médií společnosti Microsoft. Nová verze je méně trhavá a nepřeskakuje. Opravdu, říká Li, příští vydání multimediálního přehrávače společnosti Microsoft bude zahrnovat toto hladké schéma, s laskavým svolením pekingské laboratoře.
Dynastie Gates?
Na druhé straně laboratoře z Liova dema hrozí, že moře peněz pohltí stůl Hongjiang Zhanga. Skutečně, 10 000 z nich dorazilo za šest měsíců, říká, v žádosti o pracovní místa v novém centru pokročilých technologií, které měl vést. Aby pomohl odhalit nápor uchazečů, Zhangův tým se uchýlil ke správě písemných zkoušek v 11 městech po celé Číně. Největší výzvou jsou lidé, říká Zhang. Musíme získat správnou kombinaci partnerství, kamarádství a vedení.
Pokročilé technologické centrum – označené nápisem tučným písmem – se rychle rozrůstá a jeho zaměstnanci se letos v zimě rozrostli z 20 na 70 do jara. Představuje další krok pro laboratoř, ve kterém budou výsledky pekingského výzkumu příměji přeneseny do produktů. Cíl: urychlit proces dodávání nových technologií zpět do mateřské lodi.
Středem je Zhangovo dítě. Jako výzkumník vytvořil Zhang software, který se díval na obrázky a dokázal identifikovat, které jsou vizuálně zajímavé a které nejsou užitečné pro automatickou úpravu videa. Nyní nechává výzkum za sebou a dívá se na větší obrázek laboratoře a snaží se identifikovat ty technologie, které jsou pro produktové skupiny Microsoftu nejslibnější. Jaká je návratnost velkých investic do dlouhodobého výzkumu? ptá se. Posláním centra je na tuto otázku odpovědět.
Zhang odhaluje náznak nostalgie, když mluví o centru, které bylo spuštěno v listopadu 2003 při pětiletém výročí otevření Microsoft Research Asia. Říká, že na ceremoniálu vedoucí výzkumu společnosti, Rick Rashid, vyprávěl o úspěších laboratoře a srdečně blahopřál jejím vůdcům před vyššími představiteli společnosti Microsoft. Když jsme se rozhlédli po místnosti, měli jsme slzy v očích, říká Zhang. Mysleli jsme si: Tohle je splněný sen. Zapsali jsme se do historie.‘
Ale nyní, říká Zhang, je čas začít vytvářet budoucnost společnosti vývojem nových produktů, které bude používat širší část společnosti. Namísto posílání výzkumných manažerů přes Pacifik, aby se setkali s produktovými lidmi – což je proces, který se podle Zhanga nezvýší – pracovníci Centra pro pokročilé technologie provedou počáteční vývoj produktu v Pekingu. Jejich blízkost k výzkumným týmům usnadní určení, které technologie jsou pro produkty připraveny. Zároveň budou pravidelně navštěvovat Redmond a zůstanou dostatečně blízko produktovým týmům, aby mohli výzkumníkům poradit ohledně skutečných problémů. To je způsob, jak může výzkum vytvářet hodnotu pro společnost, říká Henry Chesbrough, odborník na technologickou strategii a management na University of California, Berkeley.
Otázkou pro Microsoft je, zda pekingská laboratoř dokáže udržet své úzce spjaté výzkumníky zaměřené na dlouhodobé problémy a zároveň urychlit krátkodobé plány vývoje produktů. Nikdo si nemyslí, že toto vyvážení bude snadné. Část ceny, kterou zaplatíte, je, že vás lidé začnou žádat o nízko visící ovoce, říká Zue z MIT. Váš úspěch se může snadno změnit v prokletí, pokud vás každý za šest měsíců žádá o něco, co potřebuje.
Pokud by to byly Spojené státy, mohla by to být nejskvělejší výzva, které laboratoř čelila. Ale tohle je Čína. Aby Microsoft Research Asia zůstal produktivní, bude také muset rozvíjet svůj vztah s vládními úředníky a akademiky, aby z toho měl prospěch nejen Microsoft, ale také jeho hostitelská země. V tom je zdroj napětí. Místní postgraduální studenti říkají, že jejich snem je pracovat pro Microsoft. Ale jděte výše v žebříčku čínské akademické obce a mluví se o temné stránce. Je škoda, že vláda a univerzitní úřady dovolují takové plýtvání talentem, říká Hongfei Wang, profesor chemického institutu Čínské akademie věd. Tito chudí postgraduální studenti ve skutečnosti nemají lepší možnosti. Ale tím, že pracují na firemních projektech, jejich příležitost k intelektuálnímu růstu je značně omezena.
Dědictví Microsoftu v Číně může v konečném důsledku záviset na tom, zda je společnost, kterou Bill vybudoval, schopna rozšířit příležitosti pro čínské občany obecně. Posílení vzdělávacího systému, poskytování technického školení pro mladé lidi, podpora místních softwarových společností a podpora ekonomického růstu jsou dobrým začátkem a chytrým podnikáním pro to, co by se jednou dalo nazvat dynastií Gatesových.
Na konci dalšího dlouhého pracovního dne Harry Shum nasedá do služebního auta, které ho odveze domů na poddivizi na předměstí Pekingu. Ředitel laboratoře zkontroluje svůj e-mail na bezdrátovém kapesním počítači a poté jej použije k volání domů. Schází se s rodinou na večeři; toto bude první noc v měsíci, kdy nepracoval pozdě. Peking je v noci klidný, tichý. Ale věci se rychle mění. Tahle dálnice tu ještě před pěti lety nebyla, říká Shum. Když se dívá dolů po této nové cestě, už myslí na zítřek, v duchu bojuje s provozem a vymýšlí, jak posunout svou laboratoř na další úroveň.