Kdo potrebuje Photoshop, če lahko Google ustvari poljubno sliko?

Google predstavlja Imagen – sistem umetne inteligence, ki iz vnesenega besedila ustvarja fotorealistične slike. Zasnovali so tudi nekakšno testno orodje, DrawBench, ki glede na 200 vzorčnih navodil ustvari slike, ki jih nato ocenijo človeški opazovalci. Na tem področju sicer niso pionirji.

Raziskovalni laboratorij umetne inteligence OpenAI je v začetku lanskega leta (5. januarja 2021) predstavil omrežje DALL-E, ki ustvarja ilustracije, fotografije in upodobitve vsega, kar lahko razumljivo opišete. Interpretira vnose naravnega jezika (kot je “zelena usnjena torbica v obliki peterokotnika”) in ustvarja ustrezne slike. Temelji na generatorju besedil GPT-3, ki je izpisovalnik “najbolj normalnih” oziroma splošno razširjenih tekstov. Gre za neke vrste močan statistični stroj. Algoritem se je “učil” iz podatkovne baze kar 500 milijard besed, število parametrov v nevronski mreži pa naj bi znašalo 175 milijard. V podjetju so poleg tega predstavili tudi algoritem CLIP, ki skuša prepoznati pomen videnih podob.

Generiranju slik iz teksta so se pred kratkim pridružili še v Googlu in predstavili algoritem Imagen. Imagen na spletu vzbuja strahospoštovanje. Je torej prišel čas, ko bo umetna inteligenca počasi izpodrinila enega prvih človeških poklicev – umetnike (ilustratorje, ustvarjalce)?

Najboljši način za opis orodja je preprosto pokazati nekaj slik – in besedilnih pozivov, ki so jih ustvarili s tem algoritmom, z nekaj kliki pa lahko tudi sami preverite moč tega orodja.

Slika 1, posnetek zaslona

Podobno kot OpenAI se je Google odločil, da tehnologije za zdaj ne bo izdal javnosti. Ker nočejo, da bi se Imagen uporabljal za generiranje napačnih reči, ga bodo zaenkrat oddajali v rabo le ozko začrtanemu krogu preizkuševalcev.

Odprtokodne alternative, usposobljene za manjše količine podatkov, kot je DALL-E Mini lahko preizkusite na spodnjih povezavah:

https://github.com/borisdayma/dalle-mini
https://huggingface.co/spaces/dalle-mini/dalle-mini

Kako dobri (oziroma slabi) so rezultati v teh različicah, preverite sami. Nekaj pa je gotovo – generatorji slik umetne inteligence so tu, da ostanejo. In morda nam bodo kmalu dosegljivi.

Benjamin Hilton na svojem Twitter profilu objavlja primerjave fotografij, generiranih s predstavljenima orodjema Imagen in DALL-E.

“A blue jay standing on a large basket of rainbow macarons.”

Slika 2, Imagen
Slika 3, DALL-E

“A brain riding a rocketship heading towards the moon.”

Slika 4, Imagen
Slika 5, DALL-E

“A robot couple fine dining with Eiffel Tower in the background.”

Slika 6, Imagen
Slika 7, DALL-E

Viri slik:

Eva Šarec
Eva Šarec
Grafična oblikovalka, ki jo najbolj zanima motion design oziroma 2D animacija. Verjame, da oblikovanje ni samo v podrobnostih in natančno postavljenih pikslih (seveda je to glavna sestavina), ampak tudi v seznamih in kljukicah na njih. Ustvarjalost je njen način življenja, ki se kaže v vsakodnevnih malenkostih. Najbolj navdušena je, ko se prebija skozi nove izzive in tekom tega nabira novo znanje.
Mnenja in stališča, izražena v tem članku, so izključno avtorjeva in ne odražajo nujno stališč podjetja W3B, d. o. o.

Naročite se na #hashtag e-novice!

Novo na #hashtag.si

Ali Claude prehiteva Chat GPT?

V zadnjih letih o umetni inteligenci (UI) slišimo že na vsakem koraku, tako v službi kot tudi izven nje in četudi si tega ne želimo priznati, je postala neizogiben del naših življenj, vsaj v svetu marketinga. Ali jo uporabljamo ali ne, za katere namene in na kakšne načine – vse to je stvar vsakega posameznika in njegovih stališč, prepričanj, želja, nenazadnje tudi vrednot. Na eni...

Spotify vstopa v igro pozornosti

Spotify ni več samo prostor za glasbo v ozadju. Postaja prostor, kjer se dejansko dogaja marketing. Z novimi formati oglaševanja, kot so carousel (drsni) oglasi v pogledu Now Playing (trenutno predvajano) in sponzorirani prevzemi seznamov predvajanja, platforma očitno presega svojo klasično audio vlogo in prehaja v bolj vizualno ter interaktivno izkušnjo.   To pomeni, da oglaševalci ne nagovarjajo več le ušes, ampak tudi oči — in predvsem pozornost uporabnika. 👀 👂  Kar ta premik dela še posebej...

Od “prompta” do dobrega besedila: nasveti za pisanje besedil s pomočjo UI

Vsi, ki berete ta članek, umetno inteligenco (UI) skoraj zagotovo že uporabljate. Za ideje, za tekste, za vse mogoče. Zato ste se tudi znašli tukaj, kjer berete stavke, ki niso bili izmišljeni s strani UI, so pa bili pregledani in tu in tam (po mnenju UI) tudi izboljšani, da zvenijo bolj »samozavestno in premišljeno ter da je manj dolgovezenja in več 'pointa«. Njene besede, ne moje. Tako mi je namreč napisala, preden mi je dala popravljeno verzijo. Nato je dodala...

Kaj vaša najljubša blagovna znamka pove o vas

Stopite v katerokoli kavarno, pisarno ali letališki salon in to boste takoj opazili: ljudje ne nosijo le izdelkov, nosijo blagovne znamke. Svetleč Appleov logotip na prenosniku, Nikeov znak na supergah, Stanleyjeva termo skodelica na mizi, morda IKEA vreča, napolnjena z živili. Radi mislimo, da blagovne znamke izbiramo zaradi cene, kakovosti ali praktičnosti. Toda marketing že dolgo pozna resnico: blagovne znamke, ki jih imamo radi, pogosto...