Nový parameter --CREF pre Midjourney je skutočný gamechanger

Umelá inteligencia (AI) sa dnes hojne využíva prakticky v celom digitálnom svete. Výnimkou nie je ani grafika. Aj my v Imagewell ju využívame čoraz viac, aby sme zlepšili naše grafické služby a nadšene skúšame najčerstvejšie novinky. Tento týždeň sme vyskúšali nový parameter --CREF v Midjourney a prinášame prekvapujúce výsledky.



2. apríla 2024 o 08:41 pridal Admin
Písmo: A- | A+

Midjourney je prelomovým hráčom vo svete generovania obrázkov umelou inteligenciou. Práve to bola doteraz najvyššia zručnosť a dosiahnuť kvalitný výsledok bolo vskutku ťažké. S parametrom --CREF je to však oveľa jednoduchšie.

Generovanie obrázkov pomocou umelej inteligencie má široké využitie, vrátane tvorby umeleckých diel, tvorby vizuálneho obsahu pre reklamy a marketing, ale aj v medicíne alebo výskume. Platí, že čím lepšie je model trénovaný a čím kvalitnejšie sú dáta, ktoré boli použité na jeho trénovanie, tým presnejšie a kvalitnejšie budú výsledné obrázky.

 

Testovanie parametru --CREF pri jednej postave

Konzistentné generovanie rovnakej postavy pomocou AI bolo v minulosti náročnou úlohou, ktorá sa bez deep-fakeov a trénovania LORA modelov nezaobišla. Preto sme ocenili nový parameter --CREF, ktorý Midjourney tento týždeň priniesol.

Parameter CREF (Cross-Reference) slúžiť ako metóda na zlepšenie generovania obrázkov pomocou umelých neurónových sietí. CREF by mohol byť zavedený ako doplnkový vstupný parameter do generatívneho modelu, ktorý by mu umožňoval využiť existujúce obrázky alebo obrazy z iných zdrojov na vylepšenie generovaných obrázkov.

Parameter --CREF funguje veľmi podobne ako parameter SREF. Na koniec príkazu stačí dopísať „--cref“ a pridať URL odkaz referenčného, zdrojového obrázka postavy. V praxi to môže vyzerať nejako takto:

  • konkrétny príkaz --cref URL_vzoru--cw (0 až 100)

--cref je odkaz na zdrojovú fotografiu postavy

--cw je váha preberania detailov postavy. 0 kopíruje len tvar a detaily postavy, 100 kopíruje úplne celú postavu aj s oblečením

 

Takto vyzerala zdrojová fotografia: 

 

 

A toto sú generované výstupy:

 

Parameter CREF pri dvoch postavách

A keďže sa v Imagewell nikdy nezastavíme na začiatku, zaujímalo nás, aké výstupy bude mať parameter --CREF pri dvoch postavách z jednej spoločnej zdrojovej fotografie. Príkaz vyzeral rovnako, iba na source fotografii boli dve postavy.

  • konkrétny príkaz --cref URL_vzoru--cw (0 až 100)

  

A Midjourney nám dal takéto výstupy:

 

 

Parameter --CREF prináša obrovský posun vpred

Midjourney sa posúva každou novinkou vpred a nastavuje latku skutočne vysoko. Tak je to aj horúcou novinkou, parametrom --CREF. Pokiaľ sme v minulosti chceli generovať rovnakú postavu vo viacerých pózach, museli sme okrem LORA a Face swap modelov generovať viacero obrázkov súčasne. Výsledok neboj nikdy optimálny a vyžadoval si systém pokus-omyl. Mohlo to vyzerať nejako takto: 

  • Prompt: "portrait photo of a beautiful woman in red t-shirt, split into 9 different images. Each image has different emotional expression, white background, shot from multiple angles, shot with Nikon Z7, 50mm lens --ar 16:9 --stylize 60 --v 6"

 

A výsledok bol takýto:

 

Ako vidíme, nový parameter --CREF je teda naozaj skutočný gamechanger, ktorý otvára dvere grafiky dokorán. Výrazne zjednodušuje generovanie obrázkov za pomoci umelej inteligencie. To však nie je všetko - toto generovanie je teraz kvalitnejšie, detailnejšie a spoľahlivejšie. Už teraz sa tešíme na novinky, ktoré Midjourney chystá a rozhodne ich vyskúšame aj my.