Kouzelné pero od Microsoftu

Kdyby měl Jian Wang svůj způsob, všechno by bylo digitální.





Nesnáším tiskárny – přeměňují digitální věci na analogové, vtipkuje a brodí se mořem kójí v Microsoft Research Asia v Pekingu v Číně. Tento čtyřicetiletý a vytáhlý počítačový vědec se specializuje na vymýšlení nových počítačových rozhraní, která překlenou propast mezi analogovým a digitálním. Jeho vlastním rozhraním je však široký úsměv, který doplňuje jeho džínovou košili a pohodové chování.

Zažehnutí ohně vynálezu

Tento příběh byl součástí našeho vydání z května 2004

  • Viz zbytek čísla
  • předplatit

Wang se zastavil u stolu, vzal obdélníkové stříbrné pero o velikosti magické značky a načmáral do papírového dokumentu nějaké opravy. Ale tohle není obyčejné pero. O několik sekund později se jeho komentáře objeví na obrazovce počítače poblíž – překrývající elektronickou verzi dokumentu přesně na místě, kam napsal na tištěnou kopii. Wangovo pero zachycuje rukopis a umožňuje uživatelům provádět změny v digitálních souborech na papíře.



Toto univerzální pero, jak ho nazývá Wang, by mohlo změnit způsob, jakým lidé komunikují s počítači. Na rozdíl od věcí, které píší na počítačové displeje nebo speciální papírové bloky, Wangův vynález používá běžný inkoust, pracuje s běžným papírem a umožňuje uživatelům kombinovat ručně psaný text a diagramy s digitálním obsahem zpráv, časopisů a webových stránek. Vedoucí pracovník na cestě letadlem by si například mohl označit papírovou kopii zprávy a později automaticky přenést změny do souboru ve svém počítači.

Wangovo digitální pero také odráží pokračující transformaci v procesu vynalézání v některých velkých podnikových laboratořích, hybridizaci osamělého vynálezce a tradičního podnikového výzkumu a vývoje. Wang je hlavním vynálezcem pera a je to jeho vhled, odvaha a kreativita, které z velké části vedly k úsilí o jeho vývoj. Ale zároveň by nemohl dosáhnout tak rychlého pokroku bez kolektivních odborných znalostí společnosti Microsoft v oblasti algoritmů rozpoznávání vzorů, počítačového vidění, technologií rukopisu a softwaru pro úpravu textu. Osobně jsem z toho opravdu nadšený, říká Rick Rashid, senior viceprezident společnosti Microsoft Research, jejíž hlavní zařízení je v Redmondu, WA. Je to příklad nového druhu inkubace produktů, kterou děláme,... takové, která spojuje lidi s mnoha různými dovednostmi k řešení jedinečného problému.

Volání společnosti Microsoft



Himálajské stohy papírů zaplňují Wangovu kancelář, navzdory jeho proklamovanému odporu k výtiskům. Uprostřed těchto připomenutí analogového světa popisuje vynálezce počátky projektu pera. Jako profesor inženýrské psychologie na Zhejiang University v Hangzhou v Číně si Wang udělal jméno v oblasti rozhraní člověk-počítač a systémů virtuální reality. Poté, v roce 1998, na vrcholu své akademické kariéry, obdržel tajuplný e-mail od Kai-Fu Lee, renomovaného výzkumníka, který právě zakládal pekingskou laboratoř Microsoftu. Lee navrhl, aby se sešli, ale byl příliš zaneprázdněn, aby vysvětlil proč. Nevím, jak přišel k mému jménu, směje se Wang a nevysvětlil, kdo to je.

Wang se cítil dobrodružně a přesto šel. Rychle zjistil, že on a Lee sdílejí ambici vytvořit uživatelské rozhraní pro počítače založené na ručním psaní. Projekt pera byl částečně inspirován Wangovou touhou umožnit mobilním počítačům zvládnout ručně psané asijské jazyky. Ale ze svého akademického výzkumu 3-D rozhraní zjistil, že pokud technologie není navržena tak, aby byla praktická a přitažlivá pro různé uživatele, nebude široce přijata. Chtěli jsme udělat průlom, ne vylepšení, říká a dodává, že v Microsoftu našel dokonalého partnera. Uvědomil jsem si, že toto je to pravé místo, pokud chcete, aby váš vynález využívaly miliony lidí, nikoli jen pár. S touto motivací Wang opustil Zhejiang University a na podzim roku 1999 se připojil k pekingské laboratoři.

Wang, Lee a hlavní skupina výzkumníků okamžitě zahájili každodenní brainstorming, aby vyřešili cíle projektu, které nakonec zahrnovaly jejich nejvyššího šéfa. Když jsme mluvili s Billem [Gatesem] o této technologii, říká Wang, uvědomili jsme si, že vynalézáme nový druh dokumentu, nejen pero. Klíčovou myšlenkou, která se hodí k podnikání společnosti Microsoft, která dělá kancelářské počítače užitečnějšími, bylo, že dokument lze uchovat v digitální podobě, i když je vytištěn – se správným typem rozhraní pera a softwaru.



Většinu čtyř let trvalo, než to fungovalo. Microsoft se nejen držel Wanga, ale také mu umožnil sestavit tým asi 20 výzkumníků, což mu umožnilo získat dovednosti v programování a hardwaru, které potřeboval k návrhu pera. Po několika chybných začátcích – včetně těžkopádné verze, která odvozovala, co uživatel píše z pohybů pera – Wangův tým využil pokroků v algoritmech počítačového vidění a založil snímání perem na jednoduchém digitálním fotoaparátu.

První výzvou výzkumníků bylo najít způsob, jak určit polohu pera na stránce. Jejich řešení zahrnuje speciální software, který při tisku dokumentu umístí na standardní kopírovací papír sotva viditelný vzor pozadí, jako je vodoznak (viz Vložení pera do...počítače níže). To umožňuje počítači nejen zjistit, kde přesně je pero vzhledem k dokumentu, ale také který dokument se upravuje, protože každá stránka má jedinečný kód. Tlakový senzor v peru spouští malou vestavěnou kameru, která pořizuje snímky uživatelova psaní. Obrázky jsou uloženy v peru na paměťovém čipu, jaký se nachází v digitálních fotoaparátech; když se pero dostane do vzdálenosti několika metrů od počítače nebo notebooku s nainstalovaným správným softwarem, přenese obrázky bezdrátově pomocí připojení Bluetooth.

Přikládání pera k...počítači



Pero obsahuje digitální fotoaparát, tlakový senzor, Bluetooth rádio a paměťový čip. Když uživatel píše na papír, fotoaparát pořizuje drobné obrázky inkoustu.
Papír má vzor pozadí, jako je vodoznak, který je vytištěn s dokumentem. Počítač pomocí tohoto kódu zjistí, kde přesně je inkoust na stránce.
Počítač bezdrátově přijímá sekvenci obrázků a rekonstruuje rukopis na správném místě v souboru digitálního dokumentu. Pomocí speciálního editačního softwaru pak může uživatel manipulovat a formátovat rukopis.

Interpretace těchto obrázků a jejich začlenění do digitálních souborů se ukázalo jako těžší problém. Wang vysvětluje, že trik spočívá v tom, že počítač rozpozná různé typy písma a kreseb – aby věděl, co je krabice, co je věta a co je čmáranice – jen ze série fotografií. Za prvé, algoritmy počítačového vidění klasifikují sekvence značek jako slova, diagramy nebo tvary, se kterými lze manipulovat. Pak software pro rozpoznávání znaků – předmět let intenzivního výzkumu v Microsoftu i jinde – dává ručně psanému textu smysl. Na obrazovce počítače se uživatelské značky zobrazují jako rukopis vložený do dokumentu. Softwarové nástroje pak dokážou převést písmo na psaný text a vykreslenou grafiku; s těmito nástroji může uživatel manipulovat, řekněme, s rámečky a textem z ručně nakresleného vývojového diagramu.

Kromě toho, že umožňuje uživatelům importovat a manipulovat s ručně psaným textem, tabulkami a grafy, říká Wang, toto pero umožní více spolupracovníkům přidávat komentáře k samostatným výtiskům dokumentu; počítač by je pak mohl všechny integrovat do stejného souboru. Konečným výsledkem, říká Wang, bude rozhraní jako přenosný skener – ale dostatečně chytré, aby porozumělo obrázkům, které zachycuje, a splnilo sen svého vynálezce přeměnit hromady analogového papíru zpět na digitální soubory.

Pervasive Pens

Mimo laboratoř, u jídla šanghajské masové polévky a dušené ryby, Wang vysvětluje, jak kultura laboratoře podporuje vynález. Kromě sdílení mentality tvrdě pracujte, jezte tvrdě, říká, jsou členové a vedoucí laboratoře zkušenými výzkumníky, kteří chápou, že průlomy vyžadují čas. Nemusíte se vždy osvědčovat za měsíc nebo dokonce za rok, říká Wang. Výzkumníci tak mají flexibilitu vyzkoušet různé přístupy – důležité pro ambiciózní projekty, jako je znovuobjevení pera.

Microsoft Research Asia je velká podniková laboratoř, která zaměstnává 150 výzkumníků na plný úvazek, ale má překvapivě málo byrokracie, říká Wang. Žádné zvláštní schvalovací postupy. Žádné těžkopádné příkazy shora. Společnost se snaží podporovat vynález tím, že dává svým inženýrům svobodu prozkoumávat zajímavé cesty dlouhodobého výzkumu, přičemž se zaměřuje na krátkodobé výsledky stanovením milníků a prováděním hodnocení projektů několikrát ročně. Díky tomu je to spíše prostředí akademického stylu, říká Wang. Publikujeme články, jezdíme na konference a hostíme mnoho hostujících profesorů. Je to otevřené prostředí.

Pozorovatelé říkají, že tato otevřenost je nezbytná pro produktivitu laboratoře, zejména v zemi s omezenou historií podnikového výzkumu. Byli úspěšní díky svým vazbám na akademickou půdu, říká Shiqiang Yang, výkonný místopředseda katedry počítačových věd a technologií na Tsinghua University, jedné z předních pekingských inženýrských škol. Bezplatná výměna nápadů se studenty a profesory posílila postavení laboratoře v akademické komunitě – a to jí pomáhá získat některé z nejlepších čínských studentů a počítačových vědců.

Úzké vazby se vyplácejí: více než 70 technologií vyvinutých v pekingské laboratoři si našlo cestu do produktů společnosti Microsoft v oblastech, jako je grafika videoher a rozpoznávání řeči pro diktování. Pokud jde o Wangovo digitální pero, mohlo by Microsoftu otevřít zcela nové trhy. Přestože komercializace je ještě několik let pryč, Wangův tým jedná s vývojovými skupinami společnosti v Redmondu. Konkrétní produktové plány ještě nebyly vytvořeny, říká Rashid, ale generuje to spoustu vzrušujících nápadů o tom, co by mohlo být možné.

Ve skutečnosti technologie vyvinuté Wangovou skupinou v průběhu projektu pera již společnosti vyplácejí dividendy. Software, který dokáže rozpoznat a manipulovat s rukopisem na obrazovce, je funkcí operačního systému Tablet PC vydaného společností Microsoft v roce 2002. Asijský trh by mohl být prvním vstupním bodem pro rozhraní, jako je digitální pero, kvůli poptávce po softwaru pro rozpoznávání a úpravy. Znaky v asijských jazycích, jejichž pouhý počet činí zadávání pomocí klávesnice únavné.

S každým novým vynálezem existuje mnoho výzev při přeměně vzrušujícího prototypu na skutečný produkt; ale tady by mu měl Wangův výcvik v psychologii a lidských faktorech dobře posloužit. Pero a jeho software je třeba zjednodušit, říká; zákazníci nebudou tolerovat další složitost. Po vyřešení zbývajících kiksů má však vynález potenciál stát se všudypřítomným kvůli známosti a pohodlí běžných per. Pero je tak pronikavé, tak výrazné a jeden z nejlepších vynálezů, říká Wang. Takže si myslím, že pero by mohlo být velmi dobrým výpočetním zařízením do budoucna.

Nakonec, říká Wang, vše na vašem stole – knihy, deníky, výtisky – bude mít digitální připojení k vašemu počítači. Říká tomu uzavření smyčky mezi analogem a digitálem. A se zvýšením výpočetního výkonu a paměti by se zařízení jako Wangovo pero mohlo stát hlavním počítačovým rozhraním, které lidé na cestách používají. Wang si představuje, že uživatelé by mohli nejen zadávat a ukládat data, ale také pomocí bezdrátového kapesního počítače přistupovat k informacím například v článku v časopise pouhým podtržením slov, která lze rozpoznat a vyhledat na webu.

S tolika prácemi však Wang nemá čas ztrácet čas. Může pracovat pro jednu z největších světových korporací, ale stále má dlouhé noční hodiny osamělého vynálezce. Po večeři, zatímco je většina Pekingu temná a tichá, se vrací do práce a je zaměřen na psaní budoucnosti rozhraní člověk-počítač.

skrýt