如何用DALL-E 3或Midjourney創作：從文字到圖像的奇蹟。

2025 iThome 鐵人賽

生成式 AI

生成式AI：從原理到未來系列第 8 篇

17th鐵人賽

weihong1206

2025-10-19 01:58:30

197 瀏覽

分享至

在生成式 AI 的世界裡，將腦海中的文字想像轉化為視覺圖像，無疑是最令人驚嘆的「魔法」。今天，我們將淺談如何運用兩大主流 AI 圖像生成工具：DALL-E 3 和 Midjourney，來實現「從文字到圖像的奇蹟」。

核心概念：提示詞 (Prompt Engineering)
在使用 DALL-E 3 或 Midjourney 進行創作時，最重要的就是你的「提示詞 (Prompt)」。這就像你給 AI 下達的指令或描述，AI 會根據這個指令來生成圖像。好的提示詞是成功的關鍵！

DALL-E 3：精準與直覺的文字解讀

DALL-E 3 的最大特色是它與 GPT 技術深度整合，能夠極其精準地理解自然語言。這意味著你不需要學習複雜的「咒語」，只需用清晰、詳細的文字描述你的想法。

如何使用 DALL-E 3 創作？

主要透過 ChatGPT 或 Microsoft Copilot 平台。

輸入提示詞：在對話框中用自然語言描述你想要的圖像。

範例提示詞：

「一個穿著宇航服的貓咪，坐在月球上，遠處是地球，風格是超寫實主義。」
「一幅水彩畫，描繪一位老人在雨中獨自撐傘，背景是繁華的東京街頭，帶點憂鬱的氛圍。」
「為我的咖啡店設計一個 Logo，簡約風格，有一隻微笑的狐狸拿著咖啡杯。」

AI 會根據你的描述生成圖像。

迭代與優化：如果不滿意，可以繼續對話，告訴 AI 哪裡需要更改。例如：「把貓咪換成老虎」、「讓月球更大一點」、「把風格改成卡通」。DALL-E 3 能理解上下文，進行精準調整。

DALL-E 3 的優勢：

極高的文字理解力：幾乎能精確地呈現你描述的內容，不容易「誤解」。
圖像內文字生成：能在圖像中生成清晰、正確的文字。
易於對話迭代：像聊天一樣調整圖像，非常適合初學者和需要精確控制的用戶。

Midjourney：藝術美學與探索的殿堂

Midjourney 以其獨特的藝術風格和出色的美學表現力而聞名，它生成的圖像往往帶有強烈的電影感、夢幻感或專業設計感。

如何使用 Midjourney 創作？

主要透過 Discord 伺服器進行操作（需要訂閱）。

加入伺服器：進入 Midjourney 的 Discord 伺服器，找到 newbies 或其他圖像生成頻道。
輸入指令：在對話框中輸入 /imagine，然後跟上你的提示詞。
範例提示詞（通常會更詳細地描述風格和參數）：

/imagine a futuristic city, neon lights, flying cars, rainy night, cinematic lighting, highly detailed, photorealistic --ar 16:9 --style raw (一個未來城市，霓虹燈，飛行汽車，雨夜，電影燈光，高度細節，超寫實攝影風格，長寬比16:9，原始風格)

/imagine an ancient wizard casting a spell in a mystical forest, ethereal glow, fantastical, volumetric lighting --ar 3:2 --v 6.0 (一位老巫師在神秘森林中施法，空靈的光芒，奇幻風格，體積光，長寬比3:2，使用V6模型)

等待生成： AI 會生成四張圖像。

選擇與變化：

U 按鈕 (Upscale)：選擇你最喜歡的圖像進行放大，獲得更高解析度的版本。
V 按鈕 (Variations)：根據某一張圖生成更多類似風格的變化版本。

重新生成：如果都不滿意，可以點擊重新生成按鈕或修改提示詞。

Midjourney 的優勢：

卓越的藝術美學：即使是簡單的提示詞，也能生成令人驚豔的藝術作品。
獨特的風格和氛圍：對於光影、色彩和構圖有其獨到的處理方式。
參數控制：透過 --ar (長寬比)、--style (風格) 等參數，可以進行更精細的控制。

總結：從文字到圖像，釋放你的想像力
DALL-E 3 和 Midjourney 各有千秋：DALL-E 3 擅長精準的文字理解和對話式調整；Midjourney 則以無與倫比的藝術美學和風格渲染見長。無論你選擇哪一個，它們都提供了一個強大的畫布，讓你將腦海中的奇思妙想，輕鬆轉化為令人驚嘆的視覺現實。現在，就開始嘗試你的第一個 Prompt，體驗從文字到圖像的奇蹟吧！

下集預告: 教你prompt的撰寫技巧