Kdo potrebuje Photoshop, če lahko Google ustvari poljubno sliko?

Google predstavlja Imagen – sistem umetne inteligence, ki iz vnesenega besedila ustvarja fotorealistične slike. Zasnovali so tudi nekakšno testno orodje, DrawBench, ki glede na 200 vzorčnih navodil ustvari slike, ki jih nato ocenijo človeški opazovalci. Na tem področju sicer niso pionirji.

Raziskovalni laboratorij umetne inteligence OpenAI je v začetku lanskega leta (5. januarja 2021) predstavil omrežje DALL-E, ki ustvarja ilustracije, fotografije in upodobitve vsega, kar lahko razumljivo opišete. Interpretira vnose naravnega jezika (kot je “zelena usnjena torbica v obliki peterokotnika”) in ustvarja ustrezne slike. Temelji na generatorju besedil GPT-3, ki je izpisovalnik “najbolj normalnih” oziroma splošno razširjenih tekstov. Gre za neke vrste močan statistični stroj. Algoritem se je “učil” iz podatkovne baze kar 500 milijard besed, število parametrov v nevronski mreži pa naj bi znašalo 175 milijard. V podjetju so poleg tega predstavili tudi algoritem CLIP, ki skuša prepoznati pomen videnih podob.

Generiranju slik iz teksta so se pred kratkim pridružili še v Googlu in predstavili algoritem Imagen. Imagen na spletu vzbuja strahospoštovanje. Je torej prišel čas, ko bo umetna inteligenca počasi izpodrinila enega prvih človeških poklicev – umetnike (ilustratorje, ustvarjalce)?

Najboljši način za opis orodja je preprosto pokazati nekaj slik – in besedilnih pozivov, ki so jih ustvarili s tem algoritmom, z nekaj kliki pa lahko tudi sami preverite moč tega orodja.

Slika 1, posnetek zaslona

Podobno kot OpenAI se je Google odločil, da tehnologije za zdaj ne bo izdal javnosti. Ker nočejo, da bi se Imagen uporabljal za generiranje napačnih reči, ga bodo zaenkrat oddajali v rabo le ozko začrtanemu krogu preizkuševalcev.

Odprtokodne alternative, usposobljene za manjše količine podatkov, kot je DALL-E Mini lahko preizkusite na spodnjih povezavah:

https://github.com/borisdayma/dalle-mini
https://huggingface.co/spaces/dalle-mini/dalle-mini

Kako dobri (oziroma slabi) so rezultati v teh različicah, preverite sami. Nekaj pa je gotovo – generatorji slik umetne inteligence so tu, da ostanejo. In morda nam bodo kmalu dosegljivi.

Benjamin Hilton na svojem Twitter profilu objavlja primerjave fotografij, generiranih s predstavljenima orodjema Imagen in DALL-E.

“A blue jay standing on a large basket of rainbow macarons.”

Slika 2, Imagen
Slika 3, DALL-E

“A brain riding a rocketship heading towards the moon.”

Slika 4, Imagen
Slika 5, DALL-E

“A robot couple fine dining with Eiffel Tower in the background.”

Slika 6, Imagen
Slika 7, DALL-E

Viri slik:

Eva Šarec
Eva Šarec
Grafična oblikovalka, ki jo najbolj zanima motion design oziroma 2D animacija. Verjame, da oblikovanje ni samo v podrobnostih in natančno postavljenih pikslih (seveda je to glavna sestavina), ampak tudi v seznamih in kljukicah na njih. Ustvarjalost je njen način življenja, ki se kaže v vsakodnevnih malenkostih. Najbolj navdušena je, ko se prebija skozi nove izzive in tekom tega nabira novo znanje.
Mnenja in stališča, izražena v tem članku, so izključno avtorjeva in ne odražajo nujno stališč podjetja W3B, d. o. o.

Naročite se na #hashtag e-novice!

Novo na #hashtag.si

Wikipedia je prepovedala uporabo UI generiranih vsebin 

Konec marca 2026 je Wikipedia sprejela eno najstrožjih odločitev v svoji zgodovini in uradno prepovedala objavo člankov, ki jih napiše umetna inteligenca.   Platforma, ki jo milijoni ljudi še vedno razumejo kot zadnjo večjo utrdbo “človeškega interneta”, je s tem jasno pokazala, da v obdobju poplave generičnih UI vsebin ne želi postati še ena zbirka besedil brez odgovornosti, avtorstva in preverljivosti.  Nova pravila prepovedujejo uporabo velikih jezikovnih modelov (LLM) za pisanje ali prepisovanje...

Met Gala: dogodek, ki že dolgo ni več samo modni večer

Met Gala je eden tistih dogodkov, ki jih skoraj ni več mogoče razumeti zgolj skozi njihovo osnovno funkcijo. Formalno gledano gre za dobrodelni večer, namenjen zbiranju sredstev za Costume Institute, modni oddelek newyorškega Metropolitanskega muzeja umetnosti, v praksi pa je Met Gala veliko več kot to. Gre za natančno premišljen in kuriran kulturni spektakel, v katerem se prepletajo moda, medijska moč, vpliv, simbolni status...

Prihodnost kreativnosti ni samo v generiranju vsebin

V preteklem mesecu smo svoja obzorja širili na SOZ Akademiji. Ravid Kuperberg, trener strukturiranega kreativnega razmišljanja v svetu komunikacije blagovnih znamk v podjetju Mindscpaes je ponudil številne zanimive vpoglede v načine razmišljanja, kako zaradi UI drugače razmišljati o idejah. UI sama po sebi še ni kreativna Eno izmed osrednjih sporočil, ki jih je izpostavil, je bil, da UI sama po sebi še ni kreativna. Lahko generira...

#INSPIRACIJA: ko kampanja ni samo kampanja 

Če iščete inspiracijo in ne pregledujete tujih kampanj, delate nekaj narobe. Tuje kampanje nam pokažejo, kako lahko isto stvar povemo na toliko različnih načinov: bolj drzno, bolj čustveno, bolj duhovito ali preprosto bolj jasno.  Včasih je dovolj že dober slogan, drugič zanimiv format in tretjič ideja, ki je tako preprosta, da se vprašamo, »Zakaj se tega nismo spomnili sami?«. In ravno zato jih je vredno spremljati, opazovati in analizirati. Niti približno zato, da bi jih kopirali, ampak zato, da lažje razumemo,...