Barion Pixel

Legvadabb álmaink digitálisan: AI ART

Benedek Csanád

2022.10.03.

10 perc

Bemutatjuk a legügyesebb és legtermékenyebb kortárs festőt: Midjourney-t. Kezet nem lehet fogni vele… mert egy program.

AI-festészet, jobb mint az igazi? A digitális ecset elveszi a grafikusok munkáját?
Egyre többen kérdezik, hogy olyan mesterséges intelligenciarendszerek, mint a DALL-E vagy a Midjourney, képesek-e kreatív feladatokat ellátni? A válasz igen, bár ember van mögötte.

Ha utálsz olvasni, rögtön lelövöm a poént, amit a többi hírmegosztó portál elfelejt közölni. A témában megjelenő cikkek többnyire azt publikálják, hogy bemondasz pár alapszót és az AI fest egy tökéletes képet. Aztán borzongsz, hogy ezek a túl okos gépek mire képesek, itt a világvége. Na, ott vagy átverve, hogy a programok rendesen elő vannak etetve stílussal, képekkel és ötletekkel (más emberek életművével), felturbózott programnak adnak be kulcsszavakat. Ettől függetlenül egy új világ partjaira raktuk a lábunkat, és ezek az első lépések.

McDonald’s in Underwater (Midjourney)
Steampunk astronaut (Midjourney)
Portrait (DALL-E)
Cliffhouse (Midjourney)

AI, de szép vagy!…
A közelmúltban jelentős változásnak lehettünk tanúi a képek létrehozásának folyamatában. A gépi tanulás és a mesterséges intelligencia beáramlása a grafika világába már nem csak futurisztikus elképzelés, hanem a jelen.

A növekedés és térhódítás kérdéseket vet fel azzal kapcsolatban, hogy a kreatív folyamatok hogyan fejlődnek vissza vagy fejlődnek előre a technológia révén. Elveszi a mesterséges intelligencia a grafikusok mesterségét vagy ők fogják használni leginkább? Erre még nem tudjuk a választ.

Az olyan rendszerek, mint a DALL-E, a DALL-E 2 és a Midjourney már olyan mesterséges intelligenciák,
programok, amelyeket arra tanítottak, hogy szöveges leírásokból képeket generáljanak.
Ezt leginkább szöveg-kép párok adatkészletének felhasználásával teszik.

Ne úgy képzeld el, hogy bemondod a Mona Lisát és lefesti, csak ha előetetted a gépet vizuális történelemmel. A sokrétű képességeik közé tartozik az állatok és tárgyak antropomorfizált változatainak létrehozása, és az elképesztően gyors adaptáció. Még érdekesebb a nem kapcsolódó fogalmak elfogadható módon történő kombinálása, valamint a meglévő képek átalakításainak alkalmazása.

Olyan új fogalmak lesznek nemsokára közismertek, mint a „disco diffusion” (AI modellező technológia, ami szövegből képet gyárt) vagy a „neurális művészet”.
A neural art tulajdonképpen az alapképből és a referenciaképből is megpróbál attribútumokat kinyerni, hogy a végeredményként kapott kép mindkettőt tartalmazza. Összemossa őket, de át is alakítja.

Midjourney / DALL-E 2 / Disco Diffusion
Neural Art

Ki ez a szorgalmas és szép festő, ez a Midjourney?
Az első, amit tudni érdemes, hogy a Midjourney nemcsak egy program, hanem egy csapat.

A Midjourney egy független kutatólaboratórium, ahol szabadalmaztatott mesterséges intelligencia programokat készítenek, amely szöveges leírásokból képeket hoz létre. 11 főállású munkatársuk van csak. Egy kis, önfinanszírozó csapat, amely a tervezésre és a mesterséges intelligenciára összpontosít. Hasonló, de jobb mint az OpenAI DALL-E, és a nyílt forráskódú Stable Diffusion. Az eszköz jelenleg bétaverzióban van, amely 2022. július 12-én lépett életbe. A Midjourney-csapatot David Holz vezeti, aki a Leap Motion társalapítója. A Midjourney freemium üzleti modellt használ, korlátozott ingyenes szinttel és fizetős szintekkel, amelyek gyorsabb hozzáférést, nagyobb kapacitást és további szolgáltatásokat kínálnak. 10-30 dollár közötti havi előfizetéseik nem is olyan vészesek.

Dino-Riders (Midjourney)

Gép az ember mögött, vagy ember a gép mögött?

Ki mit tud?
A DALL-E és a hasonló rendszerek a nyelv kompozíciós szerkezetét feltáró mondatok széles skálájához képesek elfogadható képeket létrehozni. Ugye ez a mondat is olyan szerkezetű, hogy picit értelmezned kell. Na, a gépnek ez nem nehéz. A struktúrákat azonnal megérti, az elvont fogalmakkal van nagyobb gondja.

A DALL-E rendelkezik néhány 3D-renderelő program képességeivel, de a különbség a bemenetek, inputok természetében rejlik. A 3D-renderelésnél teljes részletességgel meg kell adni, amit szeretnél. Míg a DALL-E gyakran képes „kitömni az üres helyeket”. Kisszámú objektum attribútumait is képes önállóan vezérelni.
A Midjourney ugyanezt tudja, csak még ügyesebben.

DALL-E

A képek titka
A program különleges, és a képek, amit látunk, tényleg elképesztő háttértudást feltételeznek. Ahogy már említettem: amikor látsz egy zseniális stílust, az be van táplálva. Az egyik trükk amúgy, amit nem mondanak el a „művészek”, hogy keverik a stílusmásolást és a verbális feladatot. Sőt tanítgatják a gépet. Tehát nem csak az van, hogy bemondják, hogy sci-fi hatású repülő párnát akarok vagy víz alatti McDonald’s-ot vagy 500 évvel ez előtti Nike reklámot, hanem stílusokat is megadnak hozzá.

A trükkös rásegítés, hogy olyan borultabb művészek alkotásait táplálják be, mint Thu Berchs vagy Beksinski (róla mi is írtunk) Dalí, Magritte. Az AI-ba az a komoly, hogy ezeket kombinálni is tudja.

A kész képekre aztán megint rámehetünk más stílusokkal, szűrökkel. Ezek a szoftverek sok más programot is használnak: Octane render, Unreal engine. Egy kis oktatófilm hozzá.

Amikor azt olvasod, hogy: „Midjourney – „művészetkészítő” mesterséges intelligencia, képek létrehozása szövegből”, akkor ezt nem részletezik, pedig kéne. Annyit szoktak csak írni, hogy: „Kulcsszavak alapján beírták a gépbe például, hogy art deco, 1920, 1930, illustration, cover, pain, woman, Tamara Lempicka. Erre el is kezdte kidobálni a Lempicka jellegű képeket.” Ez így nem igaz. Előtte sokat tanítgatták a programot, de a végeredmény így is elképesztő.

Art Deco, 20’s-30’s (Midjourney)
Art Deco, 20’s-30’s (Midjourney)

A Midjourney és a DALL-E igazi ereje
Az egyik legizgalmasabb funkció a nem kapcsolódó fogalmak kombinálásának képessége. Ez a tudás hatással lehet az építészet és a tervezés jövőbeni alakulására.
Az építészetet és a terméktervezést erősen megihletheti, hogy látszólag nem kapcsolódó koncepciókból meríthet ihletet. Az AI generatív modellek arra ösztönzik a tervezőket, hogy több lehetőséget fedezzenek fel új nézőpontból, mivel csökkenti a szándék és a megvalósítás közötti időt. Hozzáférhető módot kínálnak ezek a programok az adatokkal való játékra, és ötletes variációkat generálnak kreatív problémák megoldásaira.

A Series of Houses (Midjourney)
A postmodern dreamscape with an austere pink building painted in the style of Giorgio de Chirico (Midjourney)
A luxury real estate development in the metaverse (Midjourney)

Mesterséges serénység és szerénység az építészet szolgálatában
Egyes kutatók „ artificial serendipity”-nek, azaz mesterséges élénkségnek/serénységnek nevezik ezeket a rendszereket, amelyek maximalizálják a variációs lehetőséget. Megnyitva ezzel a kreatív képességek új tárházát a klasszikus módszereken túl. Az építészek már kísérleteznek ezekkel az eszközökkel, hogy olyan összetett kérdéseket tegyenek fel a gépnek, mint a várostervezés és a meglévő terek lehetőségei. Mások az építészeti kulcsszavakat a kortárs tervezési klisékkel, a popkultúrára és a különféle művészeti stílusokra való hivatkozásokkal kombinálják. Lehet épületeket tervezni, vizualizálni gyorsan. Bár ezeknek a modelleknek vannak korlátai, a terület soha nem látott ütemben fejlődik. A közelmúltban az Apple kiadta Gaudit, egy „neurális építészt”, amely egy lépéssel tovább viszi ezt a folyamatot azáltal, hogy 3D-s jeleneteket hoz létre olyan szöveges felszólításokból, mint a „Menj fel az emeletre!” vagy „Menj át a folyosón!”. Nehéz megjósolni, hogy ezek a fejlemények merre visznek bennünket, de hatásuk már most érezhető. Az építészet és a tervezés területén ezek az eszközök hatékony, kreatív segítséget nyújtanak a lehetőségek gyors átlátására, optimalizálására és tesztelésére.

Apple – Gaudi

Mestersége művészet? Szériaművészet?
Itt a kérdés egyáltalán nem új. A meccs a reneszánsz alatt lefutott, de legkésőbb a XIX. század végén. Hogy ne kelljen esztétika szemináriumot tartani, egy Picasso-aranyköpéssel el lehet az egészet magyarázni. Picassót amikor megkérdezték miért így fest, azt válaszolta, ha Leonardo azt festhetett volna, amit akart, ő is így festett volna, ahogy én. Vagyis régebb a reneszánszban, a tökéletes ábrázolás, a forma tökéletesítése volt a lényeges. Amint ezt elérték, már nincs hova. A festészet a művészet, az ember belső útja tulajdonképp. Kivetülések.

A művészeti utazás minden lépésének megvan a maga miértje, oka, ami egy életút végül is. Kísérletezések, kudarcok, önmagára találások sorozata. Az izgalom, hogy jobb művészetet hozzon létre, hogy képes valaki valami újat alkotni, ami talán megérinti az emberek szívét. Éveket töltött el az alkotó tanulással és kudarcokkal, újra és újra. Ez a szépsége az egésznek.

Most a technológiával ez olyan, mint a képek gyorsétterme: jó, de felejthető. Mindig többet termel és gyorsabban fest. De még sportteljesítmény se, mert digitális. És legyünk őszinték, sokan csak az AI-képeket használják arra, hogy még többen kövessék őket a közösségi média felületein.

A valódi művészet nem fog leállni, mert nem a funkció a célja. Ellenben sok embernek
mindegy, hogy valódit vagy szériát kap. Nem is tud különbséget tenni.

„Jó” hír viszont, hogy amíg nem volt AI-art hamisító mesterséges intelligencia, akit eddig nem érdekelt a kultúra, most sem fog foglalkozni vele.

A koncepcióművészet és az építészek viszont egészen biztosan sokat fogják használni ezeket a gépeket. Én már csak egy tökéletes nyomtatót várok. És mehet a AI-pénznyomtatás, szigorúan művészeti alapon.

Cyberpunk Warrior (Midjourney)
Calm Before the Storm (Midjourney)
American Gothic-Star Wars (DALL-E)
The God of Empty Universe (Midjourney)
Mutual curiosity – DALLE2
Celebrities 18th Century Pre-Raphaelite Portraits (Midjourney)
Dorothy road (Midjourney)
Nike: 500yrs (Midjourney)
Tisztelt Olvasó!
A magazinnak szüksége van a segítségedre, támogass minket, hogy tovább működhessünk!

A 4BRO magazint azért hoztuk létre, hogy olyan egyedi és minőségi tartalmak születhessenek, amelyek értéket képviselnek és amik reményeink szerint benneteket is érdekelnek.

Az ilyen tartalomalkotás azonban időigényes és egyben költséges feladat, így ezen cikkek megszületéséhez rátok, olvasókra is szükség van.
A magazin működtetésére nagylelkű és folyamatos támogatásotok mellett vagyunk csak képesek. Kérjük, szállj be te is a finanszírozásunkba, adj akár egyszeri támogatást, vagy ha megteheted, legyél rendszeres támogatónk.

Amennyiben értékesnek érzed munkánkat, kérlek támogasd a szerkesztőséget a cikkek megosztásával.
Kapcsolódó cikkek

Glen E. Friedman fotóöröksége: rap, gördeszka és punk – minden, ami hardcore

Ed Hopper – a mozi és a festészet kölcsönhatása

Bruno Pontiroli abszurd realizmusa

Merrick Morton morcos képei, avagy Los Angeles alulnézetből

Ed Repka – a thrash metál Picassója

Paweł Kuczyński az internet lengyel lelkiismerete