PROMPT W MIDJOURNEY
Midjourney jest modelem generatywnego AI z tekstu do obrazu. Oznacza to, że zamienia tekst (prompt) na obraz – jednak w przeciwieństwie do LLMów (czyli modeli językowych jak czat GPT) nie najlepiej radzi sobie z językiem naturalnym. W związku z tym zadając instrukcje do generowania grafiki warto przestrzegać kilku zasad i rozumieć ich strukturę. Tą właśnie instrukcję, nazywamy promptem (co dosłownie tłumaczy się na “podpowiedź” i… zupełnie mi nie pasuje).
W najprostszym ujęciu prompt możemy podzielić na co najmniej trzy główne sekcje:
- referencje graficzne (zadany wcześniej obraz)
- prompt tekstowy (opis tego, co ma wygenerować MJ)
- parametry
Jedyną obowiązkową częścią jest tekst prompta tekstowego – wszystko inne można pominąć. I tak, prompt może być jednym słowem (nawet literą, symbolem albo emoji), ale częstokroć rozbudowujemy je bardziej. Zdarza się też, że prompty przypominają całe opowiadania albo zawierają bardzo wiele części składowych. Ponieważ jednak prompt, dobry prompt jest podstawą pracy z Midjourney warto przyjrzeć się zasadom, które nimi rządzą.
OPTYMALNA DŁUGOŚĆ
To może być trudne do przełknięcia, ale to prawda – im krótszy, tym lepszy. Naprawdę. Midjourney jest w stanie przeprocesować prompta zawierającego maksymalnie do 60 słów. Wpisać ich można dużo więcej, nie ma limitu znaków w wiadomosci w discordzie, ale wpływ wówczas będzie praktycznie żaden. Warto pamiętać jednak, że każde słowo generuje swój szum i swoje artefakty stąd uzyskanie pożądanego efektu przy długim prompcie jest dużo trudniejsze. Zatem – mniejsza liczba słów sprawia, że każde słowo ma silniejszy wpływ i może zaistnieć w grafice.
JĘZYK I GRAMATYKA
Midjourney Bot teoretycznie nie rozumie gramatyki, jednak od wersji 5 developerzy starają się poprawiać rozumienie “języka naturalnego”, więc opisywanie jest dobrym pomysłem. Błędy gramatyczne zostaną zignorowane, ale literówki będą miały wpływ. Czyli “girl is walking on line” da nam równie dobre, albo nawet lepsze rezultaty niż “girl, walk, line”. Interpunkcja tak naprawdę nie ma znaczenia poza kilkoma znakami specjalnymi. Bot MJ ignoruje kropki, przecinki, małe i wielkie litery. Nic nie stoi na przeszkodzie, żeby ich używać i mieć przejrzystego prompta, ale nie ma to wpływu na efekt końcowy. Znaki, których użycie jest zarezerwowane na specjalne okazje to:
- myślnik – a właściwie podwójny myślnik definiujący parametry (o tym później)
- dwukropek – a właściwie podwójny dwukropek oddzielający części miltiptompta (i o tym później)
JAK TAM ANGIELSKI?
Prawda jest też prosta – im lepszy Twój angielski, tym lepszy Twój prompt. Jakkolwiek od wersji 7 Midjourney potrafi “tłumaczyć” (czyli zinterpretować) prompta napisanego po polsku – tak wciąż najlepsze efekty daje stosowanie języka angielskiego. Zachęcam do korzystania zarówno z bardziej zaawansowanych tłumaczy (DeepL, na przykład) i wszelkiego rodzaju tezaurusów (słowników bliskoznacznych)
- szukaj wyrazów bliskoznacznych – te najbardziej oklepane przymiotniki, dają najbardziej oklepane rezultaty. Do tego często nie są wystarczające. Zatem skoro “big” nie jest dość duże – daj “enormous”, “gigantic”.
- nie bój się wyrafinowanych słówek – stosuj zamienniki, wyrazy bliskoznaczne, starodawne określenia i sklejaj je w zaskakujące sposoby
- wepchnij czasownik gdzie się da – niesie ze sobą więcej dynamiki i pozwala dookreślać sytuacje – czyli zamiast “girl with cake” określ “girl eating / baking / dropping cake”
- korzystaj z archetypów, czyli spróbuj poszukać, czy nie da się łatwiej i prościej opisać swojej postaci i zamiast – “dziewczyna w okularach z plecakiem i z książkami w ręce” napisać “studentka”. Rezultat może być podobny, a dostaniesz więcej miejsca na znaczące słowa
PRZERZUCAJ
Pamiętaj, że Twój prompt może potrzebować po prostu więcej szans. Jeśli użyjesz /imagine tylko raz i porzucisz go na pierwszej siatce, prompt miał dokładnie jedną szansę na wyrażenie opisu. A “jedna szansa” nigdy nie działa zbyt dobrze.
Więc przerzuć… po całości, bez modyfikacji. Kolejne efekty mogą się mocno różnić, bo bez żadnych dodatkowych wskazówek MJ zacznie od nowa generować obraz. Daj mu szansę.
Wybieraj najbardziej interesujące obrazy, upscaleuj i dodawaj kolejne wariacje. Jeśli nie podobają Ci się żadne – przerzuć jeszcze raz wyniki – ale daj swojemu promptowi szansę (tak z 3 – 5 razy). Potem dopiero się zabieraj za modyfikację prompta.
EKSPERYMENTUJ
Najfajniejsza rzecz – możesz też olać wszystko, co powyżej i pisać po swojemu. Rezultaty i tak pewnie będą ciekawe. Ale wrzucę tutaj kilka pomysłów:
- teksty piosenek – no przysięgam, niewiele tak epickich grafik mam jak z wrzuconego cytatu “running to the edge of the world” czy “maze of moments” z jakiegoś kawałka muzycznego
- kreuj zaskakujące wyrażenia – “solution of sophisticated aberration” bądź inne zlepki wyrafinowanych słówek też dają przeciekawe efekty
- układanie historii z emoji – generuje bardzo ciekawe efekty
DOBIERZ ODPOWIEDNIE PARAMETRY
Parametry dodawane na końcu prompta mają także bezpośredni i pośredni wpływ na obraz. Od drobnostek typu – Midjourney dużo łatwiej wygeneruje obraz całej sylwetki w rozdzielczości –ar 3:5 niż 16:9, a skończywszy na tym, że obniżenie wartości parametru –s do 0 pozwala na lepsze odwzorowywanie dosłownej zawartości prompta. Więcej o parametrach – tutaj.
