Bemutatjuk a legügyesebb és legtermékenyebb kortárs festőt: Midjourney-t. Kezet nem lehet fogni vele… mert egy program.
AI-festészet, jobb mint az igazi? A digitális ecset elveszi a grafikusok munkáját?
Egyre többen kérdezik, hogy olyan mesterséges intelligenciarendszerek, mint a DALL-E vagy a Midjourney, képesek-e kreatív feladatokat ellátni? A válasz igen, bár ember van mögötte.
Ha utálsz olvasni, rögtön lelövöm a poént, amit a többi hírmegosztó portál elfelejt közölni. A témában megjelenő cikkek többnyire azt publikálják, hogy bemondasz pár alapszót és az AI fest egy tökéletes képet. Aztán borzongsz, hogy ezek a túl okos gépek mire képesek, itt a világvége. Na, ott vagy átverve, hogy a programok rendesen elő vannak etetve stílussal, képekkel és ötletekkel (más emberek életművével), felturbózott programnak adnak be kulcsszavakat. Ettől függetlenül egy új világ partjaira raktuk a lábunkat, és ezek az első lépések.
AI, de szép vagy!…
A közelmúltban jelentős változásnak lehettünk tanúi a képek létrehozásának folyamatában. A gépi tanulás és a mesterséges intelligencia beáramlása a grafika világába már nem csak futurisztikus elképzelés, hanem a jelen.
A növekedés és térhódítás kérdéseket vet fel azzal kapcsolatban, hogy a kreatív folyamatok hogyan fejlődnek vissza vagy fejlődnek előre a technológia révén. Elveszi a mesterséges intelligencia a grafikusok mesterségét vagy ők fogják használni leginkább? Erre még nem tudjuk a választ.
Az olyan rendszerek, mint a DALL-E, a DALL-E 2 és a Midjourney már olyan mesterséges intelligenciák,
programok, amelyeket arra tanítottak, hogy szöveges leírásokból képeket generáljanak.
Ezt leginkább szöveg-kép párok adatkészletének felhasználásával teszik.
Ne úgy képzeld el, hogy bemondod a Mona Lisát és lefesti, csak ha előetetted a gépet vizuális történelemmel. A sokrétű képességeik közé tartozik az állatok és tárgyak antropomorfizált változatainak létrehozása, és az elképesztően gyors adaptáció. Még érdekesebb a nem kapcsolódó fogalmak elfogadható módon történő kombinálása, valamint a meglévő képek átalakításainak alkalmazása.
Olyan új fogalmak lesznek nemsokára közismertek, mint a „disco diffusion” (AI modellező technológia, ami szövegből képet gyárt) vagy a „neurális művészet”.
A neural art tulajdonképpen az alapképből és a referenciaképből is megpróbál attribútumokat kinyerni, hogy a végeredményként kapott kép mindkettőt tartalmazza. Összemossa őket, de át is alakítja.
Ki ez a szorgalmas és szép festő, ez a Midjourney?
Az első, amit tudni érdemes, hogy a Midjourney nemcsak egy program, hanem egy csapat.
A Midjourney egy független kutatólaboratórium, ahol szabadalmaztatott mesterséges intelligencia programokat készítenek, amely szöveges leírásokból képeket hoz létre. 11 főállású munkatársuk van csak. Egy kis, önfinanszírozó csapat, amely a tervezésre és a mesterséges intelligenciára összpontosít. Hasonló, de jobb mint az OpenAI DALL-E, és a nyílt forráskódú Stable Diffusion. Az eszköz jelenleg bétaverzióban van, amely 2022. július 12-én lépett életbe. A Midjourney-csapatot David Holz vezeti, aki a Leap Motion társalapítója. A Midjourney freemium üzleti modellt használ, korlátozott ingyenes szinttel és fizetős szintekkel, amelyek gyorsabb hozzáférést, nagyobb kapacitást és további szolgáltatásokat kínálnak. 10-30 dollár közötti havi előfizetéseik nem is olyan vészesek.
Gép az ember mögött, vagy ember a gép mögött?
Ki mit tud?
A DALL-E és a hasonló rendszerek a nyelv kompozíciós szerkezetét feltáró mondatok széles skálájához képesek elfogadható képeket létrehozni. Ugye ez a mondat is olyan szerkezetű, hogy picit értelmezned kell. Na, a gépnek ez nem nehéz. A struktúrákat azonnal megérti, az elvont fogalmakkal van nagyobb gondja.
A DALL-E rendelkezik néhány 3D-renderelő program képességeivel, de a különbség a bemenetek, inputok természetében rejlik. A 3D-renderelésnél teljes részletességgel meg kell adni, amit szeretnél. Míg a DALL-E gyakran képes „kitömni az üres helyeket”. Kisszámú objektum attribútumait is képes önállóan vezérelni.
A Midjourney ugyanezt tudja, csak még ügyesebben.
A képek titka
A program különleges, és a képek, amit látunk, tényleg elképesztő háttértudást feltételeznek. Ahogy már említettem: amikor látsz egy zseniális stílust, az be van táplálva. Az egyik trükk amúgy, amit nem mondanak el a „művészek”, hogy keverik a stílusmásolást és a verbális feladatot. Sőt tanítgatják a gépet. Tehát nem csak az van, hogy bemondják, hogy sci-fi hatású repülő párnát akarok vagy víz alatti McDonald’s-ot vagy 500 évvel ez előtti Nike reklámot, hanem stílusokat is megadnak hozzá.
A trükkös rásegítés, hogy olyan borultabb művészek alkotásait táplálják be, mint Thu Berchs vagy Beksinski (róla mi is írtunk) Dalí, Magritte. Az AI-ba az a komoly, hogy ezeket kombinálni is tudja.
A kész képekre aztán megint rámehetünk más stílusokkal, szűrökkel. Ezek a szoftverek sok más programot is használnak: Octane render, Unreal engine. Egy kis oktatófilm hozzá.
Amikor azt olvasod, hogy: „Midjourney – „művészetkészítő” mesterséges intelligencia, képek létrehozása szövegből”, akkor ezt nem részletezik, pedig kéne. Annyit szoktak csak írni, hogy: „Kulcsszavak alapján beírták a gépbe például, hogy art deco, 1920, 1930, illustration, cover, pain, woman, Tamara Lempicka. Erre el is kezdte kidobálni a Lempicka jellegű képeket.” Ez így nem igaz. Előtte sokat tanítgatták a programot, de a végeredmény így is elképesztő.
A Midjourney és a DALL-E igazi ereje
Az egyik legizgalmasabb funkció a nem kapcsolódó fogalmak kombinálásának képessége. Ez a tudás hatással lehet az építészet és a tervezés jövőbeni alakulására.
Az építészetet és a terméktervezést erősen megihletheti, hogy látszólag nem kapcsolódó koncepciókból meríthet ihletet. Az AI generatív modellek arra ösztönzik a tervezőket, hogy több lehetőséget fedezzenek fel új nézőpontból, mivel csökkenti a szándék és a megvalósítás közötti időt. Hozzáférhető módot kínálnak ezek a programok az adatokkal való játékra, és ötletes variációkat generálnak kreatív problémák megoldásaira.
Mesterséges serénység és szerénység az építészet szolgálatában
Egyes kutatók „ artificial serendipity”-nek, azaz mesterséges élénkségnek/serénységnek nevezik ezeket a rendszereket, amelyek maximalizálják a variációs lehetőséget. Megnyitva ezzel a kreatív képességek új tárházát a klasszikus módszereken túl. Az építészek már kísérleteznek ezekkel az eszközökkel, hogy olyan összetett kérdéseket tegyenek fel a gépnek, mint a várostervezés és a meglévő terek lehetőségei. Mások az építészeti kulcsszavakat a kortárs tervezési klisékkel, a popkultúrára és a különféle művészeti stílusokra való hivatkozásokkal kombinálják. Lehet épületeket tervezni, vizualizálni gyorsan. Bár ezeknek a modelleknek vannak korlátai, a terület soha nem látott ütemben fejlődik. A közelmúltban az Apple kiadta Gaudit, egy „neurális építészt”, amely egy lépéssel tovább viszi ezt a folyamatot azáltal, hogy 3D-s jeleneteket hoz létre olyan szöveges felszólításokból, mint a „Menj fel az emeletre!” vagy „Menj át a folyosón!”. Nehéz megjósolni, hogy ezek a fejlemények merre visznek bennünket, de hatásuk már most érezhető. Az építészet és a tervezés területén ezek az eszközök hatékony, kreatív segítséget nyújtanak a lehetőségek gyors átlátására, optimalizálására és tesztelésére.
Mestersége művészet? Szériaművészet?
Itt a kérdés egyáltalán nem új. A meccs a reneszánsz alatt lefutott, de legkésőbb a XIX. század végén. Hogy ne kelljen esztétika szemináriumot tartani, egy Picasso-aranyköpéssel el lehet az egészet magyarázni. Picassót amikor megkérdezték miért így fest, azt válaszolta, ha Leonardo azt festhetett volna, amit akart, ő is így festett volna, ahogy én. Vagyis régebb a reneszánszban, a tökéletes ábrázolás, a forma tökéletesítése volt a lényeges. Amint ezt elérték, már nincs hova. A festészet a művészet, az ember belső útja tulajdonképp. Kivetülések.
A művészeti utazás minden lépésének megvan a maga miértje, oka, ami egy életút végül is. Kísérletezések, kudarcok, önmagára találások sorozata. Az izgalom, hogy jobb művészetet hozzon létre, hogy képes valaki valami újat alkotni, ami talán megérinti az emberek szívét. Éveket töltött el az alkotó tanulással és kudarcokkal, újra és újra. Ez a szépsége az egésznek.
Most a technológiával ez olyan, mint a képek gyorsétterme: jó, de felejthető. Mindig többet termel és gyorsabban fest. De még sportteljesítmény se, mert digitális. És legyünk őszinték, sokan csak az AI-képeket használják arra, hogy még többen kövessék őket a közösségi média felületein.
A valódi művészet nem fog leállni, mert nem a funkció a célja. Ellenben sok embernek
mindegy, hogy valódit vagy szériát kap. Nem is tud különbséget tenni.
„Jó” hír viszont, hogy amíg nem volt AI-art hamisító mesterséges intelligencia, akit eddig nem érdekelt a kultúra, most sem fog foglalkozni vele.
A koncepcióművészet és az építészek viszont egészen biztosan sokat fogják használni ezeket a gépeket. Én már csak egy tökéletes nyomtatót várok. És mehet a AI-pénznyomtatás, szigorúan művészeti alapon.