iT邦幫忙

2025 iThome 鐵人賽

DAY 2
0
生成式 AI

AI咒術迴戰~LLM絕對領域展開系列 第 2

Day2-生成式AI(虎杖悠仁)

  • 分享至 

  • xImage
  •  

https://ithelp.ithome.com.tw/upload/images/20250910/201632573lBiCrnrhi.jpg

生成式AI

是一種人工智慧,主要能力是創造全新與原創內容,而不是僅僅分析或分類現有數據。這些內容可以涵蓋文字、圖片、音樂、影片、程式碼等等多種形式

它的運作方式,簡單來說,是透過學習大量的現有數據,例如:大量的圖片、文章、程式碼,找出其中模式、結構、風格。當接收到指令(稱為 提示prompt)時,它能夠運用學到的知識,生成符合指令要求的新內容。這些新內容雖然基於學習數據,但卻是獨一無二的

如何生成圖片?

1️⃣文字生成圖片(Text-to-Image)

  • 運作方式:使用者輸入一段文字描述想要生成的圖片內容、風格、場景、物件等等,AI模型會理解這段文字,並根據學習到的視覺概念和藝術風格,創造出一張全新的、符合描述的圖片
  • 技術基礎:常見的技術包括擴散模型(Diffusion Models)和生成對抗網路(GANs)變體。擴散模型透過逐步去除雜訊來生成圖像,而GANs則包含一個生成器和一個判別器相互競爭來提升圖像品質
  • 代表性工具/模型:Midjourney、DALL-E 3 (整合於 ChatGPT/Copilot)、Stable Diffusion、 Adobe Firefly 等等
  • 應用:藝術創作、設計原型、廣告素材、遊戲場景生成、插畫製作等等

2️⃣圖片生成圖片 (Image-to-Image)

  • 運作方式:使用者提供一張基礎圖片,並加上文字指令,要求 AI 對圖片進行修改、風格轉換、添加元素或改變某些部分
  • 應用:圖片編輯、風格遷移(例如:將照片變成梵谷風格)、圖像修復、擴展圖片邊界(Outpainting)等等

如何生成程式碼?

程式碼生成是生成式 AI 在提升軟體開發效率方面的革命性應用

  • 運作方式:AI模型透過學習數十億行來自公開程式碼庫(GitHub)原始碼、文件和相關文本進行訓練它學習了不同程式語言的語法、常用的程式設計模式、演算法、函式庫用法,甚至程式碼註解的風格。使用者可以用自然語言描述想要實現的功能、演算法,或者直接要求AI補全一段程式碼、解釋某段程式碼、找出錯誤(Debug)、或將程式碼從一種語言轉換成另一種語言
  • 技術基礎:主要基於大型語言模型(LLMs),與生成文字的AI模型類似,但經過針對程式碼數據的特別訓練和微調

1️⃣代表性工具/模型

  • GitHub Copilot:直接整合在開發環境 (IDE) 中,根據上下文和註解即時提供程式碼建議和生成
  • ChatGPT (OpenAI):可以理解自然語言的程式設計需求,生成程式碼片段、完整函式,甚至進行除錯
  • Gemini (Google):同樣具備強大程式碼生成、解釋和除錯能力
  • Amazon CodeWhisperer:類似Copilot程式碼輔助工具

2️⃣應用

  • 程式碼自動補全 (Code Completion):根據已輸入程式碼,預測並建議接下來的程式碼
  • 根據描述生成程式碼 (Code Generation):輸入功能描述,AI生成對應的程式碼實現
  • 程式碼解釋 (Code Explanation):解釋複雜的程式碼片段的功能和邏輯
  • 程式碼除錯 (Debugging):協助找出程式碼中的錯誤並提供修正建議
  • 程式碼翻譯 (Code Translation):將程式碼從一種程式語言轉換成另一種
  • 撰寫單元測試 (Unit Test Generation):自動生成測試案例以驗證程式碼功能

總結

生成式AI正在快速發展,它不僅能理解人類的指令,更能以前所未有的方式進行創造。在圖片生成方面,它賦予了每個人視覺化創意的能力;在程式碼生成方面,它極大地提升了開發者的生產力,改變了軟體開發的流程。當然,生成式AI也帶來一些挑戰,例如:生成內容的準確性、潛在的偏見、版權歸屬、以及對就業市場的影響等,這些都是需要持續關注和探討的議題


上一篇
Day1-咒術鐵人賽
下一篇
Day3-AI發展與趨勢(伏黑惠)
系列文
AI咒術迴戰~LLM絕對領域展開4
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言