211service.com
Použití neuronových sítí ke klasifikaci hudby
Nová práce od studentů na University of Hong Kong popisuje nové využití neuronových sítí, sbírek umělých neuronů nebo uzlů, které lze trénovat k provádění široké škály úkolů, které se dříve používaly pouze při rozpoznávání obrazu. Studenti použili a konvoluční síť naučit se funkce, jako je tempo a harmonie, z databáze skladeb, které se šíří napříč 10 žánry. Výsledkem byl soubor trénovaných neuronových sítí, které dokázaly správně identifikovat žánr písně, což je v informatice považováno za velmi těžký problém, s přesností větší než 87 procent. V březnu skupina vyhrála cenu za nejlepší práci na festivalu Mezinárodní multikonference inženýrů a počítačových vědců .
To, co umožnilo tento výkon, byla hloubka konvoluční neuronové sítě studenta. Konvenční kernel machine neuronové sítě jsou, jak řekl Yoshua Bengio z University of Montreal, mělký . Tyto sítě mají příliš málo vrstev uzlů – analogických vrstvám neuronů ve vaší mozkové kůře – na extrahování užitečného množství informací ze složitých přírodních vzorců.
Ve svých experimentech studenti pod vedením profesora Toma Li zjistili, že optimálním počtem vrstev pro rozpoznání hudebního žánru jsou tři konvoluční (nebo myšlenkové) vrstvy, přičemž první vrstva přijímá nezpracovaná vstupní data a třetí vrstva vydává žánr. data.
V každé vrstvě (na obrázku výše) jediný uzel neboli neuron slyší pouze malou část skladby, asi 23 milisekund. Každý uzel se však z 50 procent překrývá se svými sousedy, a tak celkem mnoho uzlů v neuronové síti slyší o něco více než dvě sekundy skladby.
Zatímco pro člověka může být těžké identifikovat žánr skladby v tak krátkém čase, tento konkrétní algoritmus to dělá snadno, když je aplikován na skladby ze standardní knihovny používané pro testování automatického rozpoznávání žánrů. V následných testech, ve kterých jej studenti vystavili hudbě mimo knihovnu, na které byl trénován, však propadl.
Neschopnost jejich algoritmu fungovat ve volné přírodě připisují nedostatečně velké školicí knihovně, na které se síť učila především. Protože jejich algoritmus dokázal prokousat 240 skladeb za pouhé dvě hodiny, hongkongští studenti tvrdí, že má potenciál být docela škálovatelný.
Je zajímavé, že spletitá neuronová síť, na které je tato práce založena, byla původně inspirována zkoumáním zrakové kůry koček. Kočky jako savci mají zrakovou kůru ne nepodobnou té naší. Experimenty provedené na příbuzném druhu, fretce, ukázaly, že na rozdíl od toho, co bylo provedeno v tomto článku, kde byla vizuální neuronová síť aplikována na problém se sluchem, je možné znovu připojit mozek savce k vidět se svou sluchovou kůrou .
Pokud jsou spletité neuronové sítě stejně flexibilní jako percepční systémy savců, na kterých jsou založeny, proč se neaplikují na všechny druhy jiných problémů vnímání v AI?