在許多影片網站上,我們經常看到一些迷人的AI主持人,她們能以逼真的方式播報內容,讓觀眾留連忘返。那麼,你曾經好奇過她們是如何實現的嗎?
今天,我們將深入探討 Stable Diffusion 的一個引人注目的擴充套件 "SadTalker"。透過這個套件,我們只需提供一張圖片和聲音,就能夠實現讓一個圖像裡的人像真實的人一樣說話的驚奇效果。
讓我們一同探索這個令人驚嘆的技術,讓我們的占卜師開口說話。
任務名稱:占卜師為你解籤中---使用SadTalker,讓照片幻化成影片。
AIGC神器:Stable Diffusion SadTalker
使用費用:免費本次AIGC任務成果
:
選取你要訓練的圖像和聲音檔
設定 Perprocess
crop是裁切, 主要以頭部為主
full是全部圖像
Still Mode(減少手部運動,與預處理全尺寸一起使用)
這個選項會減少頭部搖晃的動作,如果 Perprocess 選 full,通常會勾選,效果最佳。
點選 Generate 就行了
SadTalker 是一個令人難以置信的技術奇蹟。它允許我們將聲音融入圖像,為占卜師的形象賦予語言和情感,仿佛她擁有自己的聲音和思想。這項技術在影片內容創作、虛擬角色開發和互動體驗方面具有巨大的潛力。
不需要複雜的編程或專業知識,SadTalker 提供了簡單而強大的界面,讓任何人都能輕鬆使用。只需上傳圖像,提供聲音,然後觀察奇蹟發生。
SadTalker 的應用遠不止於此。無論你是內容創作者、遊戲開發者還是數位藝術家,都可以通過這項技術探索新的創作可能性。為你的角色、虛擬世界或故事情節增添生動的語音,讓你的作品更具吸引力和互動性。