Microsoft Demos Augmented Vision

Dnes výzkumníci Microsoftu předvedou software, který dokáže v reálném čase překrývat počítačově generované informace na digitalizovaném pohledu na skutečný svět.





Změněné vidění : Tento notebook používá software rozšířené reality vyvinutý inženýry společnosti Microsoft. Dokáže rozpoznat polohu osoby pomocí vestavěné kamery. V této ukázce vedou virtuální bubliny k virtuálnímu hrnci zlata.

Přidání dodatečných vizuálních dat k zobrazení videa je technika známá jako rozšířená realita. Michael Cohen , hlavní výzkumný pracovník společnosti Microsoft Research v Redmondu, WA, říká, že tento přístup by mohl budoucím chytrým telefonům přidat další rozměr. Mohli byste být na ulici, držet zařízení nahoře a ono by mohlo rozpoznat restauraci a dodat hodnocení a menu, říká. Chytrý telefon s displejem s rozšířenou realitou by mohl také překrýt trasu autobusu a odhad, kdy má příští autobus přijet na vrchol konkrétní ulice. V podstatě se stává vaším portálem k informacím, říká Cohen.

Cohen a jeho kolegové předvedou technologii rozšířené reality na TechFest , každoroční přehlídka výzkumných projektů společnosti Microsoft, v Redmondu. Jejich software, který běží na malém přenosném počítači, analyzuje scény z kamery, odpovídá těm, které jsou uloženy v databázi, a překrývá doplňkové informace na displeji. Výzkumníci poznamenávají, že chytrý telefon s rozšířenou realitou by mohl pomoci inženýrům umožnit vidět potrubí nebo elektrické kabely pod ulicí. V ukázce na TechFestu bude software použit k tomu, aby přivedl lidi na honbu za pokladem ke skryté výhře ve formě (virtuálního) hrnce zlata.



Rozšířená realita je aktivní oblastí výzkumu již více než deset let, i když často vyžadovala náhlavní displej a výpočetní vybavení v hodnotě batohu. V posledních letech se mobilní telefony a přenosné počítače s kamerami a dalšími senzory staly dostatečně výkonnými, aby zvládly výpočetní zátěž potřebnou pro provoz systému rozšířené reality. Výzkumníci z Nokie a Kolumbijské univerzity například také vyvíjejí systémy rozšířené reality a japonský startup tzv. Tonchidot doufá, že promění koncept v produkt.

Většina systémů rozšířené reality se musí umět přesně orientovat, aby fungovaly spolehlivě. Někteří lokalizují svou polohu pomocí GPS nebo triangulací několika signálů Wi-Fi a určují, jakým směrem míří pomocí akcelerometru a digitálního kompasu. Zařízení Microsoft s rozšířenou realitou se zaměřuje na schopnost rozpoznávat objekty ve scéně pomocí sofistikovaných algoritmů počítačového vidění. Vzhledem k tomu, že demonstrace probíhá v kontrolovaném prostředí konferenčního sálu, výzkumníci nepoužívají senzory pro detekci polohy; místo toho se spoléhají pouze na počítačové vidění.

Rozpoznání prvků scény bez ohledu na úhel nebo osvětlení je významnou výzvou. Cohen a jeho kolega Simon Winder, vedoucí výzkumný inženýr ve společnosti Microsoft, vyvinuli algoritmy, které provádějí tento úkol snímek po snímku pro přenos videa v reálném čase. Algoritmus okamžitě přiřazuje snímky k dříve analyzovaným snímkům uloženým v databázi. Při vývoji algoritmu výzkumníci určili nejlepší parametry nebo charakteristiky, které pomohou systému přizpůsobit se každé scéně. Cohen vysvětluje, že použili strojové učení k rychlému testování různých parametrů a určení těch, které poskytnou nejlepší shodu.



Pro dnešní demo pořídil Cohenův tým snímky konferenčního sálu, ve kterém se TechFest koná. Fotografie byly analyzovány pomocí softwaru pro počítačové vidění a klíčové prvky byly uloženy do databáze na přenosném počítači, který k zachycení scény využívá vestavěnou videokameru.

Přibližně za desetinu nebo patnáctinu sekundy je software schopen rozpoznat scénu a vyhledat ji v databázi, říká Cohen. U hry s honbou za pokladem představené během TechFestu software zobrazuje stopu bublin, které ukazují směr, kterým by měl uživatel jít, aby našel cenu.

Vzhledem k tomu, že jde pouze o výzkumný projekt, Cohen zdůrazňuje, že stále existuje spousta prostoru pro zlepšení. Za prvé, parametry používané k identifikaci fyzických rysů objektů by mohly být upřesněny, aby bylo párování ještě přesnější, říká.



Další výzvou ke zvážení je, jak by tento druh systému fungoval v méně kontrolovaném prostředí, říká Kari Pulli , výzkumný pracovník společnosti Nokia. Nejběžnější aplikací rozšířené reality je použít ji jako průvodce muzeem, říká. To je snadné, protože prostředí je pevně dané. Úkolem je zajistit, aby takové systémy mohly fungovat v neznámém kontextu, jako je městská ulice. Pulli však věří, že by to mohlo být možné díky databázím vlastněným společnostmi Microsoft, Google a Navteq, které obsahují obrázky pohledů na ulice.

Cohen říká, že je optimistický v tom, že algoritmy počítačového vidění vyvinuté jeho týmem by mohly mít nesčetné využití – od systémů rozšířené reality po hraní her a robotiku – ale nepředpokládá, že by je v dohledné době mohl použít v konkrétním produktu Microsoftu.

skrýt