Neuralnett rydder opp musikkbiblioteker
NyheterEr M.I.A. pop, elektronisk eller hip-hop?
Å få ditt digitale bibliotek organisert kan være et mareritt - og det hjelper ikke at noen plateselskaper glemmer å legge til sjangertagger i MP3-filer helt og holdent.
Nå har datavitenskapere i Taiwan utviklet et neuralt nettverksprogram som automatisk kan klassifisere datastyrt musikkfiler basert på deres takt og tempo.
Datastyrt kritiker
Chang-Biau Yang av National Sun Yat-sen University spiller musikkfilen til hans neurale nettverk, som analyserer takt og tempo ved å bruke to hovedmetoder for klassifisering av musikk - Ellis og Dixon-metodene - oppkalt etter oppfinnerne deres. Programvaren gir deretter ut en generell musikalsk sjanger.
I denne første læringsfasen korrigerer forskerne feilene og gir treffene tilbake til det neurale nettverket, slik at det bygger opp en lydprofil av hvordan forskjellige musikkfiler høres i hver annen sjanger. Når det nevrale nettverket har blitt trent, kan det klassifisere en hel samling musikkfiler.
Det neste trinnet er å bruke Ellis- og Dixon-metodene for å ytterligere bekrefte sjangeren til hver nevronklassifisert gruppe musikkfiler. Disse metodene bruker forskjellige signalbehandlingstilnærminger for å lytte til musikkfilen og for å bestemme toppunktet som samsvarer med musikalsk takt. De kan brukes til å estimere tempo og beat mønster.
Det taiwanske laget har testet sin tilnærming på en samling av flere hundre ballroom dance musikkfiler. Deres system har klassifisert forskjellige musikkstiler, som cha-cha-cha, jive, quickstep og tango, med varierende grad av suksess. Yang foreslår at videreutdanning av det neurale nettverket med klassiske, jazz- og popmusikkfiler vil tillate det å klassifisere flere forskjellige musikksamlinger automatisk.