Day-10 有圖有真相-DALL-E、Michelangelo、MixerBox ImageGen

2023 iThome 鐵人賽

DAY 10

自我挑戰組

ChatGPT！啟動！系列第 10 篇

15th鐵人賽 chatgpt

bluepumpkin

2023-09-20 23:27:41

650 瀏覽

分享至

0. 前言

昨天我們使用了image search跟gif search這兩個plugin來搜尋圖片跟GIF，但是搜尋結果有時候差強人意，這個時候就來試試自己做圖片吧!今天要使用Michelangelo和其他插件來帶大家認識OpenAI的另一個強項:Dall-E模型。

1. DALL-E、DALL-E2

DALL-E和DALL-E 2是由OpenAI使用深度學習方法開發的文本到圖像模型。這些模型能夠根據prompts生成數字圖像。DALL-E最初於2021年1月公開，並使用了一個修改過的GPT-3版本來生成圖像。2022年4月，OpenAI宣布了DALL-E 2並於2022年7月20日進入了beta階段。此外DALL-E 2也作為API發布，允許開發者將模型集成到他們自己的應用程序中。(API部分將會在最後五天解說)

軟件的名稱
- 是動畫機器人角色 WALL-E 和西班牙超現實主義藝術家 Salvador Dalí 名稱的拼音。
能力
- DALL-E 可以生成多種風格的圖像，包括照片般逼真的圖像、繪畫和表情符號。它可以正確地在新穎的組合中放置設計元素，而不需要明確的指示。
倫理問題
- DALL-E 2 的訓練數據經過過濾以去除暴力和性圖像，但這在某些情況下會增加偏見。
技術限制
- DALL-E 2 的語言理解有限，有時無法區分 "A yellow book and a red vase" 和 "A red book and a yellow vase"。

如果想直接從OpenAI官網的DALL-E玩玩看也行，不過需要另外付費，他每次生成都要花credits，而且一次買就要花15美元買115點credits(豪貴>_<)

1.1. 使用

這邊讓大家稍微看一下會長怎樣，我輸入的prompt是:A futuristic neon lit weapon，翻譯是霓虹燈效果的武器
它會生成四張圖片給你，選一張喜歡的點進去，可以看到右上角有Edit、Variations、Share和Save，後面兩個選項應該不用多說，就稍微解釋前面兩個好了。

Edit

它會給你一個橡皮擦(?)你可以把不滿意的地方擦掉，它會重新在你擦掉的位置生成圖像，其餘則不會改變。
擦完一樣按Generate，消耗一點credits它又會給你四張圖片(包括原圖共五張)

Variations

與Edit不同的是，Variations會直接以這張圖片的風格元素重新再給你四張(同樣包括原圖共五張)
旁邊的歷史紀錄可以看到我其實試了很多不同主題，對於他的生成圖片能力我只能說時好時壞，可能是因為我不會下文生圖的prompts或是官網的可調選項比較有限制，所以我是不推薦花這15美，或是可以使用接下來要介紹的插件玩玩看再決定。

2. Michelangelo

這個插件是基於DALL-E模型運作的，並且我在一開始向他詢問如何使用及應該如何給他prompt(Day-4提到的小祕訣:問它如何給prompt)，他的回應如下
可以看到有一個重點要素是選擇風格，所以我除了主題和服女孩以外，還指定了動漫風格
啊?和服呢?結果我的和服完全消失了，所以我又問了一次，然後他就回應用完本月的五次使用額度了QwQ(之前的測試亂玩用了四次)
但我覺得已經很好了，畢竟是免費讓你使用的插件，而且圖片品質也不低。

3. MixerBox ImageGen

嘿對這個工具從名稱上就能看出來跟前面那些Mixer開頭的插件一樣，都是MixerBox導流打廣告的產品，所以說實在我原本對他的期望不太高，直到他回應生成的圖片後我稍微改觀了，看起來好像效果不錯的樣子OwO
到網頁查看圖片，發現MixerBox果然還是死性不改，在圖片加了一堆浮水印=_=。不過至少生成的圖片元素該有的都有，算是差強人意。

4. 結語

今天除了介紹OpenAI自家的DALL-E以外還玩了兩個插件Michelangelo和MixerBox ImageGen，效果其實都不錯，但就是讓我感覺到文生圖的prompts精準度必須比平常使用ChatGPT高，否則就會生出一堆四不像的怪物。以後有機會再來介紹我曾經玩過的Midjourny和Stable Diffusion，有興趣當然也歡迎大家自行研究，然後跟我們分享哦~