【Day 06】占卜師為你解籤中---使用SadTalker，讓照片幻化成影片

2023 iThome 鐵人賽

DAY 6

AI & Data

30天深度探索免費生成式AI工具：實踐多樣AIGC應用系列第 6 篇

15th鐵人賽

Jason Hung

2023-09-21 00:30:03

1174 瀏覽

分享至

導言：

在許多影片網站上，我們經常看到一些迷人的AI主持人，她們能以逼真的方式播報內容，讓觀眾留連忘返。那麼，你曾經好奇過她們是如何實現的嗎？

今天，我們將深入探討 Stable Diffusion 的一個引人注目的擴充套件 "SadTalker"。透過這個套件，我們只需提供一張圖片和聲音，就能夠實現讓一個圖像裡的人像真實的人一樣說話的驚奇效果。

讓我們一同探索這個令人驚嘆的技術，讓我們的占卜師開口說話。

任務使用的工具簡介及成果：

任務名稱：占卜師為你解籤中---使用SadTalker，讓照片幻化成影片。
AIGC神器：Stable Diffusion SadTalker
使用費用：免費
本次AIGC任務成果：

設定的步驟：

選取你要訓練的圖像和聲音檔
設定 Perprocess
crop是裁切, 主要以頭部為主
full是全部圖像
Still Mode（減少手部運動，與預處理全尺寸一起使用）
這個選項會減少頭部搖晃的動作，如果 Perprocess 選 full，通常會勾選，效果最佳。
點選 Generate 就行了

探索技術奇蹟：

SadTalker 是一個令人難以置信的技術奇蹟。它允許我們將聲音融入圖像，為占卜師的形象賦予語言和情感，仿佛她擁有自己的聲音和思想。這項技術在影片內容創作、虛擬角色開發和互動體驗方面具有巨大的潛力。

不需要複雜的編程或專業知識，SadTalker 提供了簡單而強大的界面，讓任何人都能輕鬆使用。只需上傳圖像，提供聲音，然後觀察奇蹟發生。

啟發更多創意：

SadTalker 的應用遠不止於此。無論你是內容創作者、遊戲開發者還是數位藝術家，都可以通過這項技術探索新的創作可能性。為你的角色、虛擬世界或故事情節增添生動的語音，讓你的作品更具吸引力和互動性。

任務完成，就這麼簡單。你也可以發揮無限的創意，開始你的AI主持人創作之旅吧！

附錄：

【Day 05】讓美少女占卜師對你說---使用Clipchamp 的文字轉語音功能

【Day 07】照片放大術：魔法般地調整照片尺寸，生成未拍攝到的景色---使用Clipdrop Uncrop

系列文

30天深度探索免費生成式AI工具：實踐多樣AIGC應用共 48 篇

RSS系列文訂閱系列文

16 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

30天深度探索免費生成式AI工具：實踐多樣AIGC應用系列 第 6 篇