Tvrtka za umjetnu inteligenciju koja je pokrenula Stable Diffusion nedavno je najavila lansiranje novog modela Stable Audio 2.0. Model može generirati stereo zvuk od 44,1 kHz u trajanju do 3 minute, što je gotovo uobičajena duljina za većinu pjesama. To je značajno povećanje u odnosu na izvornu verziju koja je mogla generirati samo 90 sekundi glazbe.
Korisnik samo treba unijeti naredbe prirodnog jezika ili prenijeti glazbene isječke kao referencu, a model može generirati sadržaj koji korisnik želi. Stable Audio 2.0 je treniran na AudioSparx skupu podataka s više od 800.000 zvukova. Trenutno je besplatan i otvoren za javnost. Generirana glazba može se komercijalizirati. Za korištenje se možete prijaviti svojim Google računom.
Izvor: PCEkspert.com