Kdo potrebuje Photoshop, če lahko Google ustvari poljubno sliko?

Google predstavlja Imagen – sistem umetne inteligence, ki iz vnesenega besedila ustvarja fotorealistične slike. Zasnovali so tudi nekakšno testno orodje, DrawBench, ki glede na 200 vzorčnih navodil ustvari slike, ki jih nato ocenijo človeški opazovalci. Na tem področju sicer niso pionirji.

Raziskovalni laboratorij umetne inteligence OpenAI je v začetku lanskega leta (5. januarja 2021) predstavil omrežje DALL-E, ki ustvarja ilustracije, fotografije in upodobitve vsega, kar lahko razumljivo opišete. Interpretira vnose naravnega jezika (kot je “zelena usnjena torbica v obliki peterokotnika”) in ustvarja ustrezne slike. Temelji na generatorju besedil GPT-3, ki je izpisovalnik “najbolj normalnih” oziroma splošno razširjenih tekstov. Gre za neke vrste močan statistični stroj. Algoritem se je “učil” iz podatkovne baze kar 500 milijard besed, število parametrov v nevronski mreži pa naj bi znašalo 175 milijard. V podjetju so poleg tega predstavili tudi algoritem CLIP, ki skuša prepoznati pomen videnih podob.

Generiranju slik iz teksta so se pred kratkim pridružili še v Googlu in predstavili algoritem Imagen. Imagen na spletu vzbuja strahospoštovanje. Je torej prišel čas, ko bo umetna inteligenca počasi izpodrinila enega prvih človeških poklicev – umetnike (ilustratorje, ustvarjalce)?

Najboljši način za opis orodja je preprosto pokazati nekaj slik – in besedilnih pozivov, ki so jih ustvarili s tem algoritmom, z nekaj kliki pa lahko tudi sami preverite moč tega orodja.

Slika 1, posnetek zaslona

Podobno kot OpenAI se je Google odločil, da tehnologije za zdaj ne bo izdal javnosti. Ker nočejo, da bi se Imagen uporabljal za generiranje napačnih reči, ga bodo zaenkrat oddajali v rabo le ozko začrtanemu krogu preizkuševalcev.

Odprtokodne alternative, usposobljene za manjše količine podatkov, kot je DALL-E Mini lahko preizkusite na spodnjih povezavah:

https://github.com/borisdayma/dalle-mini
https://huggingface.co/spaces/dalle-mini/dalle-mini

Kako dobri (oziroma slabi) so rezultati v teh različicah, preverite sami. Nekaj pa je gotovo – generatorji slik umetne inteligence so tu, da ostanejo. In morda nam bodo kmalu dosegljivi.

Benjamin Hilton na svojem Twitter profilu objavlja primerjave fotografij, generiranih s predstavljenima orodjema Imagen in DALL-E.

“A blue jay standing on a large basket of rainbow macarons.”

Slika 2, Imagen
Slika 3, DALL-E

“A brain riding a rocketship heading towards the moon.”

Slika 4, Imagen
Slika 5, DALL-E

“A robot couple fine dining with Eiffel Tower in the background.”

Slika 6, Imagen
Slika 7, DALL-E

Viri slik:

Eva Šarec
Eva Šarec
Grafična oblikovalka, ki jo najbolj zanima motion design oziroma 2D animacija. Verjame, da oblikovanje ni samo v podrobnostih in natančno postavljenih pikslih (seveda je to glavna sestavina), ampak tudi v seznamih in kljukicah na njih. Ustvarjalost je njen način življenja, ki se kaže v vsakodnevnih malenkostih. Najbolj navdušena je, ko se prebija skozi nove izzive in tekom tega nabira novo znanje.

Naročite se na #hashtag e-novice!

Novo na #hashtag.si

Oblikovanje spletne strani, uporabniškega vmesnika ali uporabniške izkušnje ni nikoli enostavno brez pravih orodij. Na srečo imajo oblikovalci danes dostop do številnih orodij, ki ne zagotavljajo le širokega nabora funkcij, temveč so tudi enostavna za uporabo. Figma je eno najboljših...
Velika verjetnost je, da ste v pogovoru s prijatelji, ki veliko igrajo spletne igre ali se zanimajo za kripto valute in NFT-je, že slišali za Discord. A kaj zares je ta platforma, od kod izvira, kakšne so njene prednosti...
Figma

Osnove v Figmi

Kaj je Figma?  Figma je spletna aplikacija za urejanje grafik in oblikovanje uporabniškega vmesnika. Uporabite jo lahko za vse vrste grafičnega oblikovanja, od oblikovanja vmesnikov mobilnih aplikacij, oblikovanja prototipov, izdelave objav za družbena omrežja in še mnogo več.   Aplikacija se od...