
Gondolt már arra, hogy a StableDiffusion vagy az Openjourney alkalmazást használja iPaden? Míg egyes alkalmazások probléma nélkül működnek, különösen akkor, ha M1 vagy M2 processzorral rendelkező, erős iPad Pro-t használ. A NextPit elmagyarázza, hogyan hozhat létre mesterséges intelligencia képeket az iPad segítségével.
Legyen szó az App Store-ról, az Instagramról vagy a Redditről, jelenleg aligha dobhatsz egy sziklát az internetre anélkül, hogy ne találj el egy mesterséges intelligencia által generált képet. Alig néhány hónapja volt, hogy ezt a Dall-E Mini böngészőfelületeken keresztül lehetett megtenni, most pedig számtalan mesterséges intelligencia-modell szabadon elérhető gyakorlatilag mindenféle kép létrehozásához.
Amikor a StableDiffusion és mások tavaly ősszel átvágtak a tetőn, a képalkotás minden volt, csak nem felhasználóbarát. Szüksége volt egy Automatic1111 felhasználói felületre és a lehető legerősebb grafikus kártyára az asztali számítógépén. Ha nem rendelkezik a megfelelő GPU-val, a Python-alapú szkripteket a Google Colab segítségével is futtathatja, amely egy felhő alapú keretrendszer, amely gyakorlatilag korlátlan számítási teljesítménnyel rendelkezik. Vagy fizethetsz érte a Midjourney-nál, de akkor megragadsz egy viszonylag sajátos képstílusnál.
Tehát hogyan működik a StableDiffusion az iPaden?
Az idő múlásával az AI-képek előállításához szükséges számítási teljesítmény csökkent. Ahelyett, hogy csak nagy teljesítményű számítógépeken vagy felhőben futna, az AI-képek generálása immár elég lenyűgözően működik az iPaden. Két különböző alkalmazást próbáltunk ki az M2 chippel hajtott iPad Pro (2022) készüléken, amelyek erősségeit és gyengeségeit egyaránt felmutatják: a Guernikát és a Draw Thingst.
- A Draw Things letöltése iPadOS-hez: Apple App Store (ingyenes)
- A Guernika letöltése iPadOS-hez: Apple App Store (2,99 USD)
Mindkét alkalmazás egyszerűen egy grafikus felhasználói felület a képek modell használatával történő előállításához. Mindkét alkalmazás magában foglalja a letölthető képmodellek listáját. Itt-ott megtalálhatja a StableDiffusion különféle verzióit, valamint az Openjourney-t, amely a Midjourney nyílt forráskódú alternatívája. A Draw Things viszont kiterjedt listát kínál a Disneytől az animén át a Super Marioig.
A Draw Things és a Guernika is lehetővé teszi saját modellek betöltését, amelyeket mindig .CKPT fájlként oszt meg. A rövidítés a Checkpoint rövidítése, és egy fájlként lefagyasztott gépi tanulási modell “gondolkodó” állapotára utal. Az interneten számtalan forrás található minden elképzelhető modellhez.
Mely beállítások fontosak?
A modellen kívül mindkét alkalmazásban számos olyan beállítás található, amelyek nagymértékben átfedik egymást. Természetesen itt különösen fontosak az utasítások, valamint a “Lépések” és az “Útmutató skála”.
A kívánt eredmény eléréséhez a Draw Things segítségével számos beállítási lehetőség áll rendelkezésre – és egy feljavító! / © NextPit
A prompt az a szöveges utasítás, amelyből az AI-modell létrehozza a képet. Elsőre ez egyszerűbbnek hangzik, mint amilyen – mivel a kívánt stílus jó eredményéhez gyakran összetett utasításokra van szükség. Használhat negatív felszólításokat is bizonyos képstílusok, szögek vagy dolgok kizárására. A felszólításokról azonban alább külön fogunk beszélni.
A lépések azt jelzik, hogy hány lépést kell használni a kép létrehozásához. A More Steps alapvetően jobb minőséget jelent, de több számítási idő is szükséges. Az alkalmazott modelltől függően a különböző számú lépések jó eredményeket hoznak. Az útmutató skála határozza meg, hogy a modell milyen mértékben térhet el az Ön felszólításaitól. Az alacsony érték nagyobb “mesterséges szabadságot” tesz lehetővé az AI számára.
Mind a Draw Things, mind a Guernika programban más képeket is megadhat bemenetként. Erre a célra minden esetben van egy Strength csúszka, amely meghatározza, hogy az eredmény milyen közel legyen az eredeti képhez. Mivel minden generált kép egyedi, a Draw Things lehetőséget kínál akár 100 kép létrehozására egy menetben. A Guernika még egy végtelen módot is kínál!
A Guernika legtöbb beállítása ugyanaz, mint a Draw Things. A felbontást azonban (még) nem tudja módosítani. / © NextPit
Az utolsó funkció csak a Draw Things alkalmazásban érhető el: Itt állíthatja be a kimeneti felbontást. A Guernika jelenleg csak 512 × 512 pixeles képeket szállít, bár a fejlesztő hamarosan ígéretet tett egy nagyobb rugalmasságot biztosító frissítésre. A Draw Things alkalmazáshoz AI felskálázót is hozzáadhat, amely még tovább növeli a felbontást. Így 12 megapixeles vagy nagyobb felbontású képeket készíthet.
Akkor úgy tűnik, készen állsz az indulásra! M2 iPadünkön az AI-képek előállítása körülbelül 20 másodperctől öt percig tartott, a választott beállításoktól függően. Hasznosnak bizonyult a nagyon alacsony felbontású promptok alkalmasságának tesztelése, majd azonnal nagyobb mennyiségű nagy felbontású kép létrehozása, ha az eredmények ígéretesnek tűnnek.
-
Szintén érdekes: Összehasonlítva az összes iPad: Minitől a Pro-ig
Hogyan kapja meg a megfelelő felszólításokat?
A jó utasítások írása önmagában tudomány, és először meg kell tanulnod és képezned kell. Nem véletlen, hogy a megfelelő portálokon már megjelennek az első állásajánlatok „prompt engineer”-nek – vagyis valakinek, aki instrukciókat ír a mesterséges intelligencia számára.
Az Ön felszólításai szemetet hoznak a remekművek helyett? Ezután hagyja magát inspirálni a kulcsszókombinációkon, amelyeket más felhasználók használtak a nagyszerű eredmények elérése érdekében. Olyan weboldalakon, mint pl PromptHerorákattinthat az AI grafikára, és megnézheti, melyik modell vagy ellenőrzőpont, és melyik promptot használta az egyes képek létrehozásához.
Mellesleg megkérheti a ChatGPT-t, hogy írjon kiterjedt promptokat bizonyos motívumokhoz. Csak próbáld ki.
-
További információ: Szöveg írása a ChatGPT-vel
Mi a véleményed általában az AI által generált művészetről? Lenyűgözőnek, ijesztőnek vagy mindkettőnek találja a Midjourney, a StableDiffusion és mások körüli jelenlegi fejleményeket? Szeretne többet olvasni erről a témáról a NextPitnél? Kommentben várom a véleményeteket!