今天要繼續stable diffusion的動畫製作,來到了生圖的階段,先準備好基本的詠唱句子,包含正向的好品質好美、負面的壞手壞腳這些之前單跑時看起來不知道有沒有起作用的全都上,因為在跑整個大量時可能就會看到意外出現。然後剩下就是看針對影片的特點做些加強。
將這些詠唱句放入img2img的提字中,然後在圖片區開一張"video_key"的圖片先試試詠唱得好不好,主要有幾個設定:
以上試好後,在下方的Script選ebsynth Utility,點下後會多出很多選項。一樣填入project路徑。Mask看有沒有要換背景,像我是想整個畫面都換風格,那Mask Mode就改為None,Inpaint Area改設Whole picture。Face Crop大家都建議開,臉部比較不會閃爍,但我目前兩個方法的選項都會error。設定好就可以按下生成,電腦就會開始嗡嗡叫了。
這邊又是個窮人版的建議,跑單張生圖不會爆顯存,不代表跑整批時不會爆,雖然預期跑完會很久,但建議先看至少4、5張出來再離開。
跑完後會看到project目錄下多了"img2img_key"資料夾,可以檢查是否有壞圖要修。
在Ebsynth Utility既定的流程,接下來是stage3.5和stage4,分別是調色和放大圖片至原本影片大小,其中KasKuoLab大大建議可以用影片編輯軟體做,所以若沒有需求,只需要將"img2img_key"資料夾,複製成"img2img_upscale_key"就完成了。
但像由於我受顯卡限制,在生圖時是降解析度做的,那此時就需要用Extras的放大功能。點選Extras標籤選擇Batch from Directory,然後Input directory就是剛產出"img2img_key"資料夾的路徑,而Output directory就是同此project directory下,如上所說叫"img2img_upscale_key"。再將下面長寬設定好,可以先用single測試upscale的方式想要哪一個。然後按執行就可以整個資料夾轉過去了。
以上就是stage3到4的階段,總結最後成果就是要有個"img2img_upscale_key"資料夾,裡面要有對應key的編號的圖片,而且圖片的長寬需要跟原本影片相同,不然在後續步驟會出問題。
這幾天都沒有放範例圖片是因為如同文章內描述的受限於個人的硬實力,也就是電腦硬體,只能使用降低解析圖和減少輔助選項例如ControlNet的方式。這樣的設定下,即使有下負面提字,還是很容易有壞手壞腳壞臉的情況,而且也會有突然姿勢亂擺的結果,目前我還在各種嘗試,看有沒有什麼低成本但中品質的方式。