Stable Audio 2.0 sada generira do 3 minute stereo zvuka iz teksta

Stable Audio 2.0 sada generira do 3 minute stereo zvuka iz teksta

Tvrtka za umjetnu inteligenciju koja je pokrenula Stable Diffusion nedavno je najavila lansiranje novog modela Stable Audio 2.0. Model može generirati stereo zvuk od 44,1 kHz u trajanju do 3 minute, što je gotovo uobičajena duljina za većinu pjesama. To je značajno povećanje u odnosu na izvornu verziju koja je mogla generirati samo 90 sekundi glazbe.

Korisnik samo treba unijeti naredbe prirodnog jezika ili prenijeti glazbene isječke kao referencu, a model može generirati sadržaj koji korisnik želi. Stable Audio 2.0 je treniran na AudioSparx skupu podataka s više od 800.000 zvukova. Trenutno je besplatan i otvoren za javnost. Generirana glazba može se komercijalizirati. Za korištenje se možete prijaviti svojim Google računom.

Izvor: PCEkspert.com