近幾個月來,因ChatGPT的出現,推動了NLP領域的發展。
在本次鐵人賽的挑戰中,我會通過這30天的時間來講述NLP領域中的熱門模型背後的技術原理(例如:Transformer、BERT、GPT),並從實際的應用中,來撰寫這些模型的程式碼,以加深我們對該模型的映象。
同時我會還會使用不同的工具,來分析這些文字之間的關聯性,並對此結果加以解釋,從而一步步的理解NLP模型中的共同之處與運算方式。
今日學習重點 今天我們終於來到了文字翻譯技術的總結了,這次的內容會非常複雜,你可以將其想像為我們從第1天到第10天學習到的知識的綜合體,所以在今天我將把這些程式...
今日學習重點 先前有些重要的知識我們尚未完全補充,因此我在今天我將會把這些部分都告訴你,讓你知道我們為何選擇使用此種損失函數與激勵函數,同時也會實作我一直未提及...
前言 現在許多企業都不是從零開始訓練模型,而是使用大型企業提供的預訓練模型(pre-trained model)以實現企業自身的目標,而在這個步驟中,接著他們會...
前言 我們之前有學過要訓練一個優質的自然語言處理模型,必須打造出一個良好的詞嵌入向量,因此在今天的文章裡,我將為你介紹Word2Vec預訓練模型的訓練原理以及其...
前言 我們昨天提到,Word2Vec在分析句子時忽視了詞彙的順序信息,這是因為它並未考慮到整體詞彙的訊息而僅集中於局部,並且我們在講解Seq2Seq+Atten...
前言 今天我們將結束對詞嵌入預訓練模型理論的討論,在前面的幾天中你可能會發現範例程式碼中,有些部分和公式有所出入,這是因為這些詞嵌入預訓練模型原本並非「深度學習...
前言 首先我要為你們先打好預防針,因為今天的程式碼量非常龐大,這次我們將會一次性地處理Word2Vec、FastText、GloVe各模型的文字前處理方式,並且...
前言 我們之前提到的幾項技術都有其獨特的問題,例如word2vec常常會忽視詞彙的順序信息,而GLoVe則無法充分理解資料的詞性,至於時間序列模型則只能學習到下...
前言 過去我們已經完成了情緒分析、文字生成、去識別化等等的NLP任務,這些任務分別代表分類、生成、及命名實體(NER) 這些也就是自然語言處理中的三大任務,基本...
前言 昨天我們以精簡的內容來加深你對ELMo的理解,而內容簡短的原因除了其訓練方式與Word2Vec等相似之外,最主要的理由在於今天將介紹的內容極為重要,所以我...