211service.com
Počítačové reproduktory pouze pro vaše uši
Stále více lidí používá svůj počítač pro hlasovou komunikaci, jako je Skype a audio instant messaging. Z velké části však použití těchto funkcí vyžaduje, aby byla osoba buď připojena k počítači pomocí náhlavní soupravy, nebo aby mluvila přímo do mikrofonu a aby byla hlasitost reproduktoru nízká, zejména ve sdílených kancelářských prostorách.

Poslouchej tohle: Výzkumníci Microsoftu vyvinuli algoritmus, který upravuje načasování zvukových vln vyzařovaných z každého reproduktoru v poli (viz zde). Výsledkem je, že zvukové vlny se v některých částech prostoru vzájemně ruší a v jiných zesilují, čímž efektivně vytvářejí soustředěný paprsek zvuku, který funguje jako virtuální sluchátka.
Ve světle tohoto problému se výzkumníci z Microsoftu snaží udělat zvukový výstup sofistikovanější. Tým vedený Ivanem Tashevem, softwarovým architektem společnosti Microsoft, nedávno začal pracovat na algoritmu, který bude teoreticky schopen efektivně nasměrovat zvuk ze sady reproduktorů – ideálně zabudovaných v počítačovém monitoru – do uší člověka. vytváření virtuálních sluchátek; jen několik palců mimo ohnisko zvukových vln hlasitost dramaticky slábne. Zásadní je, říká Tashev, jeho algoritmus by mohl být použit širokou škálou levných reproduktorů, které by mohly být umístěny do počítačových monitorů.
Cílem je podle něj zaměřit se na zvuk tak, aby se člověk mohl procházet po kanceláři a slyšet při videokonferenci nebo audiokonferenci podporované počítačem. Informace o poloze osoby by mohly být shromažďovány hardwarovými periferiemi a přenášeny zpět do softwaru reproduktorů, což umožňuje virtuálním sluchátkům pohybovat se s uživatelem v reálném čase. Například, říká Tashev, kamera, ať už namontovaná nebo zabudovaná do monitoru počítače, a software pro zpracování obrazu by mohly určit polohu člověka. Kromě toho lze naprogramovat pole čtyř nebo více mikrofonů na monitoru počítače nebo v jeho blízkosti k lokalizaci zvuku měřením jemných časových rozdílů mezi tím, kdy zvuk dorazí ke každému reproduktoru v poli. Ve skutečnosti Tashevova předchozí práce spočívala v navrhování takových algoritmů pro lokalizaci zvuku pro typy mikrofonů, které se běžně vyskytují v rámech přenosných počítačů. Použití kamery i mikrofonu může zlepšit přesnost a vzdálenost, kterou by se člověk mohl při používání reproduktorů pohybovat.
Myšlenka zaostřování zvuku jistě není nová: vojenské radarové systémy a běžná ultrazvuková zařízení, používaná k zobrazování plodů v děloze a k nalezení rakovinných nádorů, to dělají léta. Tato technologie se nazývá beamforming a je dosaženo, když zvukové vlny z určitých reproduktorů v poli zaznamenají mikrosekundové zpoždění, vysvětluje Jiashu Chen, technický manažer společnosti Finisar Corporation, společnosti zabývající se datovou komunikací se sídlem v Sunnyvale, CA. Zpožděné zvukové vlny se spojují tak, že v některých částech prostoru se zvuk ruší a v jiných naopak zesílí.
Avšak systémy formování paprsku, které řídí slyšitelný zvuk, jako je hudba nebo lidské hlasy, jsou technicky náročnější na sestavení než radar a ultrazvuk, říká Chen, protože musí pojmout širší rozsah frekvencí; nižší frekvence vyžadují jiná hardwarová a softwarová hlediska než vyšší frekvence. Technologie zpracování signálu se zlepšila do té míry, že některé komerční produkty využívají tvarování paprsku. Yamaha například prodává reproduktory pro domácí zábavu, které odrážejí soustředěný zvuk od stěn a vytvářejí virtuální reproduktory za hlavou posluchače. Ale takové systémy jsou stále vzácné a vždy drahé.
Jedním z důvodů, proč je audio beamforming drahé, je to, že je časově náročné kalibrovat daný reálný systém, říká Tashev z Microsoftu. Každý reproduktor má nepatrné odchylky ve zvuku, který vydává, a protože zaostření zvukového paprsku vyžaduje extrémní přesnost načasování, mohou tyto nepatrné odchylky způsobit velké zkreslení zvuku. Proto je software používaný k zaostření zvuku kalibrován pro práci s konkrétním hardwarem a při jeho zakoupení je třeba celý systém zkalibrovat do tvaru místnosti, ve které je nainstalován.
Microsoft chce vyvinout software, který je dostatečně dobrý, aby fungoval s jakýmikoli reproduktory, s minimálním množstvím kalibrace vyžadované v továrně nebo uživateli. Aby mohli generičtí reproduktory zaostřit zvuk, Tashev a jeho skupina upravili dobře známé algoritmy pro vytváření paprsků. Navrhli část algoritmu pro zpracování signálu, nazývaného filtr, aby vyhovovala širokému rozsahu výrobních tolerancí nebo dat, která popisují výkon reproduktorů na různých frekvencích. Musíte vědět, jak se tyto parametry liší, říká Tashev. Když navrhujete algoritmus, děláte to pro více instancí reproduktorových polí.
Trik podle něj spočívá ve snaze najít šťastné médium mezi různými tolerancemi, aby byl výsledný zvuk srovnatelný napříč reproduktory. To vyžaduje určité doladění a výzkumníci stále určují nejlepší způsob, jak implementovat tolerance reproduktorů. Tashev však připouští, že vytvořením obecného algoritmu pro vytváření paprsků s největší pravděpodobností dojde ke kompromisu ve výkonu. Musíte udělat nějaké kompromisy, říká.
Tashev poukazuje na to, že projekt je stále v rané fázi. I když máte dobrý paprsek, nestačí to, říká. Musíte mít také lokalizátor zvuku [jako je kamera nebo speciální mikrofonní pole], který vám řekne, kam paprsek nasměrovat. Navíc říká, že aby byl algoritmus tvarování paprsku úspěšný, musel by brát v úvahu odrazy zvuku od stěn a oken v kanceláři.
Bylo by hezké vidět to tam venku, říká Stan Birchfield, profesor elektrotechniky a počítačového inženýrství na Clemson University v Clemson, SC. Birchfield pracuje na technikách zpracování obrazu, které využívají kamery k identifikaci polohy osoby, aby zlepšily zaměření mikrofonních polí. Sledování je opravdu těžký problém, říká, problém, který nikdo nenašel způsob, jak jej vyřešit pro prostředí, jako je kancelář. Je povzbudivé, že Microsoft tuto oblast zkoumá, dodává Birchfield, ale dokud společnost nemá plány na produkty, je opatrný, aby byl nadšený.
Tashev říká, že komercializace této technologie bude vyžadovat komplexní koordinaci mnoha faktorů, jejichž dosažení může trvat až tři roky, i když byl výzkumný prototyp zdokonalen. I tento krok zabere čas: Tashev říká, že skupina ještě potřebuje otestovat spolehlivost algoritmu s řadou reproduktorových polí. Aby pak společnost Microsoft přeměnila práci na produkt, bude muset najít nejlepší způsob, jak integrovat algoritmus do Windows Media Player, ujistit se, že ovladače pro hardware jsou součástí operačního systému, a, říká Tashev, najít společnosti, které mají zájem o výrobu reproduktorů pro takovou aplikaci. Ale pokud a až k tomu všemu dojde, odměna bude skvělá, říká. Lidé již nebudou potřebovat sluchátka, aby mohli vést soukromou Skype konverzaci nebo videokonferenci.