是一種人工智慧,主要能力是創造全新與原創內容,而不是僅僅分析或分類現有數據。這些內容可以涵蓋文字、圖片、音樂、影片、程式碼等等多種形式
它的運作方式,簡單來說,是透過學習大量的現有數據,例如:大量的圖片、文章、程式碼,找出其中模式、結構、風格。當接收到指令(稱為 提示
或 prompt
)時,它能夠運用學到的知識,生成符合指令要求的新內容。這些新內容雖然基於學習數據,但卻是獨一無二的
運作方式
:使用者輸入一段文字描述想要生成的圖片內容、風格、場景、物件等等,AI模型會理解這段文字,並根據學習到的視覺概念和藝術風格,創造出一張全新的、符合描述的圖片技術基礎
:常見的技術包括擴散模型(Diffusion Models)和生成對抗網路(GANs)變體。擴散模型透過逐步去除雜訊來生成圖像,而GANs則包含一個生成器和一個判別器相互競爭來提升圖像品質代表性工具/模型
:Midjourney、DALL-E 3 (整合於 ChatGPT/Copilot)、Stable Diffusion、 Adobe Firefly 等等應用
:藝術創作、設計原型、廣告素材、遊戲場景生成、插畫製作等等運作方式
:使用者提供一張基礎圖片,並加上文字指令,要求 AI 對圖片進行修改、風格轉換、添加元素或改變某些部分應用
:圖片編輯、風格遷移(例如:將照片變成梵谷風格)、圖像修復、擴展圖片邊界(Outpainting)等等程式碼生成是生成式 AI 在提升軟體開發效率方面的革命性應用
運作方式
:AI模型透過學習數十億行來自公開程式碼庫(GitHub)原始碼、文件和相關文本進行訓練它學習了不同程式語言的語法、常用的程式設計模式、演算法、函式庫用法,甚至程式碼註解的風格。使用者可以用自然語言描述想要實現的功能、演算法,或者直接要求AI補全一段程式碼、解釋某段程式碼、找出錯誤(Debug)、或將程式碼從一種語言轉換成另一種語言技術基礎
:主要基於大型語言模型(LLMs),與生成文字的AI模型類似,但經過針對程式碼數據的特別訓練和微調GitHub Copilot
:直接整合在開發環境 (IDE) 中,根據上下文和註解即時提供程式碼建議和生成ChatGPT (OpenAI)
:可以理解自然語言的程式設計需求,生成程式碼片段、完整函式,甚至進行除錯Gemini (Google)
:同樣具備強大程式碼生成、解釋和除錯能力Amazon CodeWhisperer
:類似Copilot程式碼輔助工具程式碼自動補全 (Code Completion)
:根據已輸入程式碼,預測並建議接下來的程式碼根據描述生成程式碼 (Code Generation)
:輸入功能描述,AI生成對應的程式碼實現程式碼解釋 (Code Explanation)
:解釋複雜的程式碼片段的功能和邏輯程式碼除錯 (Debugging)
:協助找出程式碼中的錯誤並提供修正建議程式碼翻譯 (Code Translation)
:將程式碼從一種程式語言轉換成另一種撰寫單元測試 (Unit Test Generation)
:自動生成測試案例以驗證程式碼功能生成式AI正在快速發展,它不僅能理解人類的指令,更能以前所未有的方式進行創造。在圖片生成方面,它賦予了每個人視覺化創意的能力;在程式碼生成方面,它極大地提升了開發者的生產力,改變了軟體開發的流程。當然,生成式AI也帶來一些挑戰,例如:生成內容的準確性、潛在的偏見、版權歸屬、以及對就業市場的影響等,這些都是需要持續關注和探討的議題