Chcete-li zjistit, co ztěžuje používání AI, požádejte ji, aby napsala popovou píseň

uncanny valley eurovision ai song soutěžící

Uncanny Valley přes UNSW





Vítejte doma vítejte doma oh oh oh svět je krásný svět. Nejsou to nejchytlavější texty. Ale poté, co jsem si Beautiful the World poslechl půl tuctukrát, refrén mi uvízl v hlavě a noha mi klepe. Není to špatné pro melodii generovanou umělou inteligencí vycvičenou na datovém souboru Eurovize písně a pláč koaly a kookaburry.

Ještě v květnu vyhrál Beautiful the World AI Song Contest, soutěž nizozemského vysílání VPRO, ve které se 13 týmů z celého světa pokusilo s pomocí umělé inteligence vytvořit hitovou popovou píseň.

Vítězný příspěvek vytvořil Neskutečné údolí , tým hudebníků a počítačových vědců z Austrálie, který používal jak lidské psaní písní, tak příspěvky umělé inteligence. Jejich hudba byla vzrušující, říká Anna Huang, výzkumnice AI ve společnosti Google Brain, která byla jednou z porotců soutěže. Hybridní úsilí skutečně zazářilo.



Mnozí věří, že krátkodobá užitečnost umělé inteligence přijde prostřednictvím spolupráce, kdy týmy lidí a strojů spolupracují, přičemž každý hraje podle svých předností. Umělá inteligence může být někdy pomocníkem, pouhým nástrojem, říká Carrie Cai, Huangova kolegyně z Google Brain, která studuje interakci mezi člověkem a počítačem. Nebo by umělá inteligence mohla být spolupracovníkem, dalším skladatelem v místnosti. Umělá inteligence vás může dokonce zvýšit na úroveň, dát vám superschopnosti. Mohlo by to být jako skládat s Mozartem.

Aby k tomu ale došlo, nástroje umělé inteligence se budou muset snadno používat a ovládat. A AI Song Contest se ukázal jako užitečný test, jak toho dosáhnout.

Huang, Cai a jejich kolegové se podívali na různé strategie, které různé týmy používají ke spolupráci s AI. V mnoha případech se lidé snažili přimět stroje, aby dělaly, co chtěli, a nakonec vymýšlejí řešení a hacky. Výzkumníci identifikují několik způsobů, jak by bylo možné vylepšit nástroje AI, aby byla spolupráce snazší.



Častým problémem bylo, že s velkými modely AI je těžké komunikovat. Mohli by vytvořit slibný první návrh písně. Ale neexistoval způsob, jak dát modelu zpětnou vazbu pro druhý průchod. Týmy nemohly jít dovnitř a vyladit jednotlivé části nebo nařídit AI, aby byla melodie veselejší.

Nakonec většina týmů použila menší modely, které produkovaly specifické části písně, jako jsou akordy nebo melodie, a pak je ručně sešívaly. Uncanny Valley použilo algoritmus k porovnání textů a melodií, které byly vytvořeny například různými umělými inteligencemi.

Další tým, Dadaboti x Portrét XO , nechtěli svůj refrén opakovat dvakrát, ale nedokázali najít způsob, jak nasměrovat AI ke změně druhé verze. Nakonec tým použil sedm modelů a spojil různé výsledky, aby získal požadovanou variantu.



Bylo to jako skládat puzzle, říká Huang: Některé týmy měly pocit, že puzzle bylo nepřiměřeně těžké, ale některé to považovalo za vzrušující, protože měli tolik surovin a barevných dílků puzzle, které museli složit.

Uncanny Valley použilo AI k poskytnutí ingrediencí, včetně melodií produkovaných modelem vycvičeným na zvuky koaly, kookaburry a tasmánského ďábla. Lidé z týmu je pak dají dohromady.

Je to jako mít svérázného lidského spolupracovníka, který není tak skvělý ve skládání písní, ale je velmi plodný, říká Sandra Uitdenbogerd, počítačová vědkyně z RMIT University v Melbourne a členka Uncanny Valley. Vybíráme bity, se kterými můžeme pracovat.



Ale to byl spíše kompromis než spolupráce. Upřímně si myslím, že lidé by to mohli udělat stejně dobře, říká.

Generativní modely umělé inteligence produkují výstup na úrovni jednotlivých poznámek – nebo pixelů v případě generování obrázků. Nevnímají větší obrázek. Na druhou stranu lidé obvykle skládají z hlediska sloky a refrénu a toho, jak skladba vzniká. Existuje nesoulad mezi tím, co AI produkuje, a tím, jak myslíme, říká Cai.

Cai chce změnit způsob, jakým jsou modely AI navrhovány, aby se s nimi snadněji pracovalo. Myslím, že by to mohlo skutečně zvýšit pocit kontroly pro uživatele, říká.

Z toho budou mít prospěch nejen hudebníci a umělci. Usnadnění používání umělé inteligence tím, že lidem poskytnete více způsobů, jak interagovat s jejich výstupy, je učiní důvěryhodnějšími, ať jsou používány kdekoli, od policejní práce na zdravotní péči.

Viděli jsme, že poskytnutí nástrojů lékařům k řízení AI může skutečně změnit jejich ochotu vůbec používat AI, říká Cai.

skrýt