我們完成了資料的爬蟲採集和人工清洗。今天,我們要將這些乾淨的圖片「精加工」:先進行結構化分割,然後實作 PyTorch/Fast.ai 的資料DataLoade...
嗨嚕大家~這幾天我們已經介紹過什麼是斷詞以及了解中文跟英文常用的斷詞工具,NLTK 以及jieba昨天文章的最尾端我們用結巴成通斷詞,但發現斷完詞的資料依然是髒...
前言昨天我們學到了邏輯迴歸的數學基礎,今天要開始準備實作環境。我們會透過 Anaconda 建立虛擬環境,並使用 Jupyter Notebook 作為開發工具...
在多 Agent 協作的世界裡,AI 團隊已經能像工廠、研究室、作家工作室般自動分工、流程化運作。但現實世界的挑戰,往往不是純粹的自動化能解決——有些關鍵時刻,...
今天來分享一下我在之前資料工程的職位上,有機會接觸到的與資料科學相關的工作內容在做什麼。其實在自己正式開始建模前,工作上有機會與 AWS 的資料科學家學習他們的...
早安大家~ 昨天我們簡單介紹了transformer 架構,我們也有提到他和當今最流行的GPT 有很大的關聯。今天我們就來聊聊GPT還有prompt 的改念!...