Grok AI sada može obrađivati slike

Generativni AI model Grok-1.5V dobio je mogućnost obrade vizualnih informacija iz dokumenata, skica i fotografija.

Grok AI sada može obrađivati slike

Muskov xAI je najavio novu generaciju multimodalnog AI modela pod nazivom Grok-1.5V, koji sada može obraditi širok izbor vizualnih informacija, uključujući dokumente, dijagrame, screenshotovbe i fotografije.

Tvrtka kaže da je Grok-1.5V konkurentan postojećim multimodalnim modelima u nizu domena, od multidisciplinarnog razmišljanja do razumijevanja dokumenata, znanstvenih dijagrama, grafikona, snimki zaslona i fotografija i posebno naglašavaju sposobnosti u razumijevanju našeg fizičkog svijeta.

Također ističu da Grok nadmašuje svoje konkurente u novom RealWorldQA benchmarku koji mjeri razumijevanje prostora u stvarnom svijetu.

Između ostaloga Grok može iz dijagrama koji opisuje jednostavnu igru ​​pogađanja u kojoj računalo generira nasumični broj koji korisnik mora pogoditi, napraviti Python kod kojim se pokreće igra kao što je opisano u dijagramu toka.

Grok AI sada može obrađivati slike

Pored toga, ako vam netko pošalje meme koji zbog nekog razloga ne možete razumjeti, možete ga pokazati Groku, koji će ga detaljno analizirati i izbaciti vam poantu u tekstualnom obliku.

I na kraju, možete mu unijeti svoj jednostavni crtež i zatražite ga da na temelju njega napiše čitavu priču.

xAI navodi da će novu inačicu Groka uskoro testirati postojeći korisnici, no zasad još nije poznato kada će to biti, a također najavljuju da će model u budućnosti unaprijediti zvukom i videom.

Izvor: Vidi.hr