Stable Audio 2.0 sada generira do 3 minute stereo zvuka iz teksta

Vesti · April 10, 2024, 7:19am

Tvrtka za umjetnu inteligenciju koja je pokrenula Stable Diffusion nedavno je najavila lansiranje novog modela Stable Audio 2.0. Model može generirati stereo zvuk od 44,1 kHz u trajanju do 3 minute, što je gotovo uobičajena duljina za većinu pjesama. To je značajno povećanje u odnosu na izvornu verziju koja je mogla generirati samo 90 sekundi glazbe.

Korisnik samo treba unijeti naredbe prirodnog jezika ili prenijeti glazbene isječke kao referencu, a model može generirati sadržaj koji korisnik želi. Stable Audio 2.0 je treniran na AudioSparx skupu podataka s više od 800.000 zvukova. Trenutno je besplatan i otvoren za javnost. Generirana glazba može se komercijalizirati. Za korištenje se možete prijaviti svojim Google računom.

Izvor: PCEkspert.com