Proč se mluvící počítače těžko poslouchají

Možná jste sledovali odhalení IBM Watson živě Ohrožení! v roce 2009. Nebo jste možná zachytili poslední reklamní kampaň této technologické firmy v televizi, která obsahuje praštěné dialogy mezi Watsonem a Serena Williamsová , Richard Thaler , nebo Bob Dylan .





I když ne, je pravděpodobné, že jste někdy komunikovali s mluvícím počítačem. Ale vytvořit přesvědčivý mluvící počítač je ve skutečnosti opravdu těžké. V an zajímavý příběh v New York Times v pondělí diskutoval technický spisovatel John Markoff o úsilí, které bylo vynaloženo na vytvoření hlasu pro Watson z IBM, a použil to jako cestu k diskusi o probíhajících snahách vytvořit přirozenější a přijatelnější počítačové hlasy.

To je jedna z fascinujících výzev interakce člověka a počítače: sociální a emocionální podněty jsou životně důležité, pokud jde o hlasovou komunikaci. Není to jen nepříjemné, když hlas asistenta, jako je Siri od Apple nebo Alexa od Amazonu, zní nepřirozeně. Může to být také nepříjemné, když takový systém nedokáže rozpoznat váš tón a podle toho modulovat svůj vlastní hlas. Poté, co se například se vzrůstající frustrací položíte stejnou otázku, připadá to jako urážka umělého hlasu, aby neustále produkoval stejnou mrtvou odpověď.

Chvíli poté, co vyšla Siri, jsem psal o tom, jak je důležité snažit se zachytit humor pro vytvoření něčeho schopného pobavit uživatele a zároveň se vyhnout jejich otravování. Potřeba začlenit umělou inteligenci do existujícího sociálního rámce může skutečně vysvětlit, proč považujeme za nutné přiřazovat charakteristiky, jako je pohlaví, dokonce i fiktivním robotům. Možná to dokonce vysvětluje, proč Apple nedávno získal emocionální , společnost, která se zaměřuje na čtení a reakci na lidské emoce.



Joaquin Phoenix se zamiluje do počítače ve filmu 'Ona'.

Je také zajímavé zvážit potenciál skutečně poutavých, emocionálně silných počítačových rozhraní, které jsou tak dobře zobrazeny ve filmu Spike Jonze. Její . Ale stále je velmi obtížné dekódovat a napodobit všechny jemnosti lidské komunikace. Jak říká Michael Picheny, senior manažer ve Watson Multimodal Lab pro výzkum IBM NYNÍ kus: Dobré rozhraní počítač-stroj je umělecké dílo a mělo by se s ním tak zacházet.

(Zdroj: New York Times )



skrýt