Kdo potrebuje Photoshop, če lahko Google ustvari poljubno sliko?

Google predstavlja Imagen – sistem umetne inteligence, ki iz vnesenega besedila ustvarja fotorealistične slike. Zasnovali so tudi nekakšno testno orodje, DrawBench, ki glede na 200 vzorčnih navodil ustvari slike, ki jih nato ocenijo človeški opazovalci. Na tem področju sicer niso pionirji.

Raziskovalni laboratorij umetne inteligence OpenAI je v začetku lanskega leta (5. januarja 2021) predstavil omrežje DALL-E, ki ustvarja ilustracije, fotografije in upodobitve vsega, kar lahko razumljivo opišete. Interpretira vnose naravnega jezika (kot je “zelena usnjena torbica v obliki peterokotnika”) in ustvarja ustrezne slike. Temelji na generatorju besedil GPT-3, ki je izpisovalnik “najbolj normalnih” oziroma splošno razširjenih tekstov. Gre za neke vrste močan statistični stroj. Algoritem se je “učil” iz podatkovne baze kar 500 milijard besed, število parametrov v nevronski mreži pa naj bi znašalo 175 milijard. V podjetju so poleg tega predstavili tudi algoritem CLIP, ki skuša prepoznati pomen videnih podob.

Generiranju slik iz teksta so se pred kratkim pridružili še v Googlu in predstavili algoritem Imagen. Imagen na spletu vzbuja strahospoštovanje. Je torej prišel čas, ko bo umetna inteligenca počasi izpodrinila enega prvih človeških poklicev – umetnike (ilustratorje, ustvarjalce)?

Najboljši način za opis orodja je preprosto pokazati nekaj slik – in besedilnih pozivov, ki so jih ustvarili s tem algoritmom, z nekaj kliki pa lahko tudi sami preverite moč tega orodja.

Slika 1, posnetek zaslona

Podobno kot OpenAI se je Google odločil, da tehnologije za zdaj ne bo izdal javnosti. Ker nočejo, da bi se Imagen uporabljal za generiranje napačnih reči, ga bodo zaenkrat oddajali v rabo le ozko začrtanemu krogu preizkuševalcev.

Odprtokodne alternative, usposobljene za manjše količine podatkov, kot je DALL-E Mini lahko preizkusite na spodnjih povezavah:

https://github.com/borisdayma/dalle-mini
https://huggingface.co/spaces/dalle-mini/dalle-mini

Kako dobri (oziroma slabi) so rezultati v teh različicah, preverite sami. Nekaj pa je gotovo – generatorji slik umetne inteligence so tu, da ostanejo. In morda nam bodo kmalu dosegljivi.

Benjamin Hilton na svojem Twitter profilu objavlja primerjave fotografij, generiranih s predstavljenima orodjema Imagen in DALL-E.

“A blue jay standing on a large basket of rainbow macarons.”

Slika 2, Imagen
Slika 3, DALL-E

“A brain riding a rocketship heading towards the moon.”

Slika 4, Imagen
Slika 5, DALL-E

“A robot couple fine dining with Eiffel Tower in the background.”

Slika 6, Imagen
Slika 7, DALL-E

Viri slik:

Eva Šarec
Eva Šarec
Grafična oblikovalka, ki jo najbolj zanima motion design oziroma 2D animacija. Verjame, da oblikovanje ni samo v podrobnostih in natančno postavljenih pikslih (seveda je to glavna sestavina), ampak tudi v seznamih in kljukicah na njih. Ustvarjalost je njen način življenja, ki se kaže v vsakodnevnih malenkostih. Najbolj navdušena je, ko se prebija skozi nove izzive in tekom tega nabira novo znanje.
Mnenja in stališča, izražena v tem članku, so izključno avtorjeva in ne odražajo nujno stališč podjetja W3B, d. o. o.

Naročite se na #hashtag e-novice!

Novo na #hashtag.si

Valentinovo

#inspiracija: srčki, poljubčki, valentinovo 💌

Vsako leto znova se zapletamo okrog istega vprašanja: je boljše valentinovo ali naj raje praznujemo gregorjevo? Ne glede na odgovor, lahko situacijo pogledamo iz vidika, da je...
Superbowl

Super Bowl, ameriški praznik oglaševanja 

Super Bowl 2026 ni bil pomemben samo kot finale ameriškega nogometa v ligi NFL, ampak tudi kot največji oglaševalski oder na svetu. Oglasi tam niso samo...
Barvna teorija

Kako barve delujejo v dizajnu

Zakaj barve nikoli ne delujejo same in zakaj jih moramo vedno gledati v kontekstu. Barva sama po sebi ne pomeni nič. Vedno jo zaznavamo v...