Nakon teksta, videa i slika, OpenAI ima alat i za generiranje ljudskog glasa

Nova tehnologija deepfakea za sintetiziranje ljudskog glasa mogla bi promijeniti štošta – svjesni su toga u OpenAI-u, pa sada predstavljaju novi model generativne umjetne inteligencije, ali ga ne puštaju u javnost. Službeno je najavljen njihov alat Voice Engine, razvijen 2022. godine kao sustav za sintezu glasa iz zadanih glasovnih predložaka, a do sada je služio za pretvaranje pisanog teksta u govor. Ako ste koristili njihov text-to-speech API ili tražili ChatGPT da vam nešto “pročita”, služili ste se rezultatima tog modela.

Potencijalno opasna tehnologija

No, u novoj verziji Voice Engine je u stanju uzeti maleni zvučni uzorak nečijeg govora, u trajanju od samo 15 sekundi, pa na temelju njega sintetizirati govor imitirajući taj naučeni glas. Takva primjena potencijalno je vrlo opasna za stvaranje lažnih sadržaja i sasvim je razumljivo zašto je OpenAI ne želi (još) pustiti u javnost.

Na svojem su blogu otkrili i nekoliko primjera, koje je izradila malena skupina ljudi zaduženih za testiranje novog modela. Navode i potencijalno vrlo pozitivne primjene, poput pomoči pri čitanju za djecu i osobe koje iz bilo kojeg razloga ne mogu same čitati, u edukaciji, prevođenju, medicini i sličnim industrijama, gdje sinteza govora može biti vrlo korisna.

Ipak, uzevši u obzir rizike, prije širenja dostupnosti tog modela OpenAI će se savjetovati s medijskom i zabavnom industrijom, obrazovnim institucijama, vladama, udrugama civilnog društva i ostalima, kako bi u tehnologiju ugradili i njihove povratne informacije te je učinili sigurnijom. “Nadamo se da ćemo započeti dijalog o odgovornoj primjeni sintetičkih glasova i tome kako se društvo može prilagoditi novim mogućnostima tehnologije. Na temelju tih razgovora i rezultata testova malog opsega, donijet ćemo utemeljeniju odluku o tome hoćemo li, i kako, primijeniti ovu tehnologiju u velikom obimu”, kažu iz OpenAI-ja.

Izvor: Bug.hr