iT邦幫忙

2023 iThome 鐵人賽

DAY 25
0
AI & Data

圖像生成 AI 的原理與應用系列 第 25

[Day 25] Stable Diffusion Online 使用介紹與試玩紀錄(二)

  • 分享至 

  • xImage
  •  

由於 Stable Diffusion Online 的功能太好玩,今天要延續昨天的內容繼續探索 Stable Diffusion Online 的功能。除此之外,對應之前在 Bing Image Creator 做的測試,今天也會測試 Stable Diffusion Online 對於中英文提示詞的表現差異,以及結合 ChatGPT 的效果~

Negative Prompt

補充一下昨天沒有介紹到的 Negative Prompt 的功能~Negative Prompt 是用於描述不希望影像中出現的東西,可以藉此避免模型產生一些奇怪的東西。

例如昨天我們在產生 "A butterfly with rainbow wings landing on a flower" 的影像時,一直苦於彩虹出現在背景,那我們就可以在 Negative Prompt 輸入不希望彩虹出現在背景:
https://ithelp.ithome.com.tw/upload/images/20231003/20162522hcP0ruWaMw.png

而在產生的圖片中,彩虹確實從背景消失了~
https://ithelp.ithome.com.tw/upload/images/20231003/20162522vpCyq42LwT.png

中英文提示詞差異

依照之前對 Bing Image Creator 做的測試,我一樣用意義相同的中英文 prompt,看產生的影像是否不同~
英文:A chubby cat lay on the grass
中文:一隻躺在草地上的圓胖的貓

由於 Stable Diffusion Online 直接控制了影像風格,所以風格上的差異就不在接下來的討論範圍~

英文 prompt "A chubby cat lay on the grass" 產生影像結果(用不同的 seed 產生三張影像):

https://ithelp.ithome.com.tw/upload/images/20231003/20162522bSVnzbHWWD.png

https://ithelp.ithome.com.tw/upload/images/20231003/20162522rYg7ICMd7t.png

https://ithelp.ithome.com.tw/upload/images/20231003/20162522vg2M30w0KX.png

總感覺 Stable Diffusion Online 產生的貓相較於 Bing Image Creator,姿勢和毛色都比較固定,都是趴姿(Bing Image Creator 產生的貓會翻肚XD),而且都有白襪子,感覺較少多樣性。

而中文 prompt「一隻躺在草地上的圓胖的貓」產生影像結果(用不同的 seed 產生三張影像)就完全不是貓啦/images/emoticon/emoticon19.gif

https://ithelp.ithome.com.tw/upload/images/20231003/20162522UdtJbevSSg.png

https://ithelp.ithome.com.tw/upload/images/20231003/20162522j2R9Nj8DLf.png

https://ithelp.ithome.com.tw/upload/images/20231003/20162522G9za8faO7e.png

我沒有放錯圖片!這些都是 Stable Diffusion Online 針對「一隻躺在草地上的圓胖的貓」的 prompt 產生的圖片@@ 顯然 Stable Diffusion Online 對中文的理解十分有限,可能僅因為 prompt 是中文而產生比較中式的風景照/images/emoticon/emoticon04.gif

組合技-利用 ChatGPT 產生合適的 prompt

這次一樣使用同一段場景描寫的文字:
「遠遠就看到出口處的向日葵,正對著剛剛走出花之都公園的我們。更遠處的灑水器潑灑著水花,戀人絮語一般落在花田間,輝煌而短暫的流星雨,吸引所有人的注意。」
--林達陽《恆溫行李》

雖然已經知道 Stable Diffusion Online 對於處理中文 prompt 的表現不理想,但還是先試試看:
https://ithelp.ithome.com.tw/upload/images/20231004/20162522tXhYYKBLoh.png

...果然。

接著請 ChatGPT 產生適合 Stable Diffusion 的輸入:
https://ithelp.ithome.com.tw/upload/images/20231004/201625221mhRc9ZlQu.png

而用 ChatGPT 轉換好的 prompt 產生的影像如下:
https://ithelp.ithome.com.tw/upload/images/20231004/20162522r2FyGkKH8c.png

雖然灑水器變成形狀奇怪的噴泉(?),但蠻符合原文描寫的情境的,而且不會產生不成型的文字。從這點來說結合 ChatGPT 和 Stable Diffusion 可能蠻適合場景插畫的繪製!/images/emoticon/emoticon34.gif

小結一下目前使用 Bing Image Creator 和 Stable Diffusion Online 的心得~感覺 Bing Image Creator 產生的影像較多樣,對於條件單純的 prompt 生成表現很不錯,也支援中文的 prompt。而 Stable Diffusion Online 產生的影像感覺就比較固定,不支援中文 prompt,但有較多可以控制的選項,且在繪製複雜場景上的表現似乎是還不錯的~/images/emoticon/emoticon72.gif


上一篇
[Day 24] Stable Diffusion Online 使用介紹與試玩紀錄(一)
下一篇
[Day 26] 我要成為詠唱大師!AI 繪圖詠唱技巧整理
系列文
圖像生成 AI 的原理與應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言