Kdo potrebuje Photoshop, če lahko Google ustvari poljubno sliko?

Google predstavlja Imagen – sistem umetne inteligence, ki iz vnesenega besedila ustvarja fotorealistične slike. Zasnovali so tudi nekakšno testno orodje, DrawBench, ki glede na 200 vzorčnih navodil ustvari slike, ki jih nato ocenijo človeški opazovalci. Na tem področju sicer niso pionirji.

Raziskovalni laboratorij umetne inteligence OpenAI je v začetku lanskega leta (5. januarja 2021) predstavil omrežje DALL-E, ki ustvarja ilustracije, fotografije in upodobitve vsega, kar lahko razumljivo opišete. Interpretira vnose naravnega jezika (kot je “zelena usnjena torbica v obliki peterokotnika”) in ustvarja ustrezne slike. Temelji na generatorju besedil GPT-3, ki je izpisovalnik “najbolj normalnih” oziroma splošno razširjenih tekstov. Gre za neke vrste močan statistični stroj. Algoritem se je “učil” iz podatkovne baze kar 500 milijard besed, število parametrov v nevronski mreži pa naj bi znašalo 175 milijard. V podjetju so poleg tega predstavili tudi algoritem CLIP, ki skuša prepoznati pomen videnih podob.

Generiranju slik iz teksta so se pred kratkim pridružili še v Googlu in predstavili algoritem Imagen. Imagen na spletu vzbuja strahospoštovanje. Je torej prišel čas, ko bo umetna inteligenca počasi izpodrinila enega prvih človeških poklicev – umetnike (ilustratorje, ustvarjalce)?

Najboljši način za opis orodja je preprosto pokazati nekaj slik – in besedilnih pozivov, ki so jih ustvarili s tem algoritmom, z nekaj kliki pa lahko tudi sami preverite moč tega orodja.

Slika 1, posnetek zaslona

Podobno kot OpenAI se je Google odločil, da tehnologije za zdaj ne bo izdal javnosti. Ker nočejo, da bi se Imagen uporabljal za generiranje napačnih reči, ga bodo zaenkrat oddajali v rabo le ozko začrtanemu krogu preizkuševalcev.

Odprtokodne alternative, usposobljene za manjše količine podatkov, kot je DALL-E Mini lahko preizkusite na spodnjih povezavah:

https://github.com/borisdayma/dalle-mini
https://huggingface.co/spaces/dalle-mini/dalle-mini

Kako dobri (oziroma slabi) so rezultati v teh različicah, preverite sami. Nekaj pa je gotovo – generatorji slik umetne inteligence so tu, da ostanejo. In morda nam bodo kmalu dosegljivi.

Benjamin Hilton na svojem Twitter profilu objavlja primerjave fotografij, generiranih s predstavljenima orodjema Imagen in DALL-E.

“A blue jay standing on a large basket of rainbow macarons.”

Slika 2, Imagen
Slika 3, DALL-E

“A brain riding a rocketship heading towards the moon.”

Slika 4, Imagen
Slika 5, DALL-E

“A robot couple fine dining with Eiffel Tower in the background.”

Slika 6, Imagen
Slika 7, DALL-E

Viri slik:

Eva Šarec
Eva Šarec
Grafična oblikovalka, ki jo najbolj zanima motion design oziroma 2D animacija. Verjame, da oblikovanje ni samo v podrobnostih in natančno postavljenih pikslih (seveda je to glavna sestavina), ampak tudi v seznamih in kljukicah na njih. Ustvarjalost je njen način življenja, ki se kaže v vsakodnevnih malenkostih. Najbolj navdušena je, ko se prebija skozi nove izzive in tekom tega nabira novo znanje.

Naročite se na #hashtag e-novice!

* obvezno polje

Privolim, da lahko W3B, d.o.o. moje osebne podatke obdeluje za naslednje namene:

Enkrat mesečno prejmete e-novice. Dovolite, da vaš e-naslov uporabimo za pošiljanje e-novic skladno s pogoji varstva osebnih podatkov. Odjavite se lahko kadarkoli.

Novo na #hashtag.si

Meta Ray-Ban

Meta Ray-Ban pametna očala

Meta ponovno preseneča javnost z napredkom v preseganju mej pri mešanju resničnega sveta z virtualnim. Že lansko leto so na Meta Connect 2024 predstavili...
TikTok

Že veste, kako deluje TikTokov algoritem?

TikTok je končno razkril delček svoje skrivnostne formule – in čeprav še vedno nimamo vpogleda v celotno sliko, nam ta nova informacija vseeno daje...
Substack

Po inspiracijo za pisanje in razmišljanje na Substack

Vsak pisec pozna občutek, ko sedi pred praznim papirjem in čaka utrinek iz neba, ki bo odprl pot pravim besedam. Na vprašanje, iz kje...