由於 Midjourney 是根據使用者的提示 ( Prompts ) 來產生圖片,因此如何撰寫「優良又有效」的提示就格外重要,篇教學會介紹一些優良的提示技巧,透過靈活運用這些技巧,就能讓產生的圖片更符合需求和想像。
原文參考:優良的提示技巧
根據 Midjourney 官方的提示規則,提示主要分成下列三種,當中「文字提示」為必須,就算有提供圖片提示,仍然需要有一些文字才能開始產生圖片:
擺放位置 | 說明 |
---|---|
最前面 ( 非必須 ) | 「圖片網址」提示,多張圖片使用逗號「, 」分隔。 |
中間 ( 必須 ) | 文字提示,不同段落文字使用逗號「, 」分隔。 |
最後面 ( 非必須 ) | 參數設定,不需要逗號分隔 ( 參考「功能參數」 )。 |
除了圖片和參數設定,提示的文字具有「順序」的規則,也能夠使用雙冒號「::」增加權重,簡單的說明如下,詳細參考「提示的權重和順序」。
判斷依據 | 說明 |
---|---|
空白 | 每個空白的前後單字都是同樣的權重 ( 連接詞、動詞、數量詞的權重可能較低 )。 |
逗號 | 逗號前後的段落都是同樣的權重 ( 太過抽象、文法較多的語句權重可能較低 )。 |
順序 | 越往前越容易是主題,越往後越容易被歸納成背景、風格或材質裝飾。 |
除了根據提示的規則和權重撰寫提示,可以參考一些常用的提示架構,提高產生圖片的成功率,下方列出常用的提示架構 ( 除了主題或主角,其他的元素都不一定要有 ):
主題或主角, 環境背景, 附加項目, 畫面構圖, 類型風格, 鏡頭
下方的例子按照架構撰寫提示詞,就能產生「一個女生在圖書館裡被一堆書包圍」的「照片」。
|項目|範例|
|--|--|--|
|主題或主角|a smiling girl|
|環境背景|in a library|
|附加項目|surrounded by books|
|畫面構圖|full body|
|類型風格|photography|
|鏡頭|wide angle lens|
下方的例子按照架構撰寫提示詞,就能產生「一個女生在玩具店裡被一堆玩具圍」的「插畫」。
|項目|範例|
|--|--|--|
|主題或主角|a smiling girl|
|環境背景|in a toy shop|
|附加項目|surrounded by toys|
|畫面構圖|full body|
|類型風格|illustration|
|鏡頭|very far away view|
由於 Midjourney 不像 ChatGPT 屬於大型語言模型,不一定會正確的去理解提示詞句中的文法,如果使用太長的句子,反而會造成 Midjourney 拆分句子去理解,也可能會忽略其中「它認為」不重要的單字,所以盡可能使用簡單明瞭的語句,不足的部分就透過其他提示詞進行補充,剩下的就讓 Midjourney 自由發揮。
不好:
Two elephants stand on a beautiful balance in the forest surrounded by many animals
一段句子裡的單字太多,除了文法容易混淆,每個單字的權重也會影響繪圖判斷。
好:
Two elephants stand on a balance, forest, many animals
將上一句拆分成不同片段,不同段落的權重大於各自的單字,也容易用順序區分進行繪圖。
在提示詞裡,「越前面」的名詞越有可能是「主角」,「越後面」的名詞越有可能是「樣式、材質或裝飾」,因此如果提示詞裡的名詞太多,又希望每個名詞都是主角,就會導致結果越發混亂且無法掌控 ( 就像真人在作畫,往往會有一個主題,不會出現一大堆主角 ),所以擬定少量的主角和場景,再透過其他形容詞修飾,就能得到比較理想的結果。
不好:
some apples, some oranges, some bananas, some grapes, on the plate, white background
太多名詞,導致結果有些水果變形或混種了。
好:
some fruits on the plate, white background
減少名詞數量,就能得到較為真實的水果。
真正的人類說話常常會使用到「負面」語句,例如「不要紅色,不要頭髮...等」,但負面語句對於 AI 繪圖而言卻不容易理解,例如「not white dog」對於 Modjourney 而言,not、white、dog 的權重都類似,因此就會使用它自己的方式去解讀和繪圖,所以盡可能使用正面提示,避免使用負面提示。
不好:
some bears, not white, not black
Midjourney 無法正確解讀負面提示,產生的結果反而充滿白色和黑色的熊。
好:
some brown bears
直接指定熊的顏色,就能夠產生正確的圖片。
由於提示詞裡每個名詞、動詞或形容詞都有其特殊意義,使用「更精準的單字」,就能產生更精準的圖片,也不容易因為要描述特定物品,導致額增加單字的狀況發生。
不好:
small dog, white background
原本希望產生小狗,但結果卻會出現「小隻的狗」。
好:
puppy, white background
使用 puppy 就能產生「幼犬」。
如果需要數量比較少的物體,盡可能使用「數字」來描述數量,雖然 Midjourney 無法百分之百畫出準確的數字 ( 畫出來的四張圖總有一兩張數量錯誤 ),但透過指定數量的方式,也比較容易控制物體出現的多寡,特別在「數量少」的時候,使用數字的方式更容易減少出現的物品數量。
不好:
there are few apples on the table
雖然使用 few 已經是非常少的數量,但畫出來的數量仍然有點多。
好:
there are three apples on the table
直接指定三顆蘋果,雖然有些圖片超過三顆,但已經大幅減少蘋果出現數量。
在提示詞裡,每一段語句都有其意義,大致上會用後方的提示詞不斷修飾前方的提示詞,因此如果使用了「數量」或「名詞」相關提示詞,就容易發生「數量疊加」,甚至會出現「材質混合」的狀況。
不好:
three fruits, two apples, one banana, white background
後方的提示詞除了數量可能會與前面的提示詞相加,也可能發生蘋果出現香蕉材質的狀況。
好:
two apples and one banana, white background
使用「and」連接並合成一句,就可以避免疊加的狀況發生。
提示詞的最前面,可以放入「參考圖片的網址」,透過提交參考圖片的方式,就能讓 Midjourney 更精確的掌握繪圖風格,參考圖片可以直接使用 Google 搜尋,或者將圖片上傳到 Discord,就能得到圖片的網址,舉例來說想要畫出類似下面這張圖片,使用圖片網址就能畫出更類似樣貌。
不好:
a robot is painting, in a studio, illustration style
雖然提示詞符合需求,但感覺好像仍缺少了很多無法形容的要素,畫出來也不太相像。
好:
https://s.mj.run/A6EGoprth0A, a robot is painting, in a studio, illustration style, --iw 2
加入參考圖片以及「
--w 2
」的設定,讓產生的圖片盡可能與參考圖片相同 ( 參考「--iw」 )。
如果不指定風格或背景,Midjourney 就會根據提示詞產生預設的風格或背景 ( 可以使用 --s
、--w
或--c
的參數,讓四張圖片風格產生變化,參考「功能參數」),因此盡可能在提示詞的後面補上參考的風格,或相關的背景描述,產生的圖片就能更符合預期。
風格參考:AI 繪圖風格大全
some monkeys, in a zoo, 1800s, real old photo
1990 年代的老照片,拍攝一些猴子在動物園裡。
some monkeys, in a zoo, doodle style
手繪風格的動物園猴子。
其實要讓 Midjourney 畫出精采的圖不難,難的是要如何畫出「精準」的圖,透過這些優良的提示技巧,就能讓畫出來的影像越來越精準,不過有時候也不一定要準確無誤,有時候只提供少量的提示詞,剩下的讓 Midjourney 自由發揮,也能得到許多意想不到的創意或精彩作品。
大家好,我是 OXXO,是個即將邁入中年的斜槓青年,我有個超過一千篇教學的 STEAM 教育學習網,有興趣可以參考下方連結呦~ ^_^