Pedro Domingos的演算法分類:
符號學派
集成學習法Ensemble Method
集成學習法:降低一個樣本的缺點,混合多種樣本子集合...
再一個集成學習方法~~
白話來說通過叠代地訓練決策樹每一棵樹都試圖糾正前一棵樹的預測錯誤從而逐步提升模型的性能
基本原理:初始化模型:使用一個簡單的模型(比如...
再續昨天!今天的筆記把論文剩餘的部分整理完
Hard negative mining 難例挖掘
由於存在大量的負樣本,所以導致嚴重的類別不平衡問題,訓練時...
講師notebook
前面兩篇都是用較小的模型做改進,這一篇開始要嘗試著使用較大模型、較大輸入、集成模型什麼意思呢?以下分別解釋
較大模型:指的是模型的結構更...
透過 edX - Large Language Modes: Application through Production 課程提到的 LLMOps Noteb...
目前除了BLEU以外找不到好的衡量GPT模型訓練結果好壞的方法,不過以之前的經驗,其實跟直接算loss也差不多,所以在pretrain與sft的階段都直接使用v...