從芝麻街角色到改變NLP的模型 如果你用Google以「BERT」作為關鍵字搜尋圖片,那麼你會發現一個奇特的現象:一隻黃色的玩偶與奇怪的網狀結構模型混雜在一起。...
BERT 全名為 Bidirectional Encoder Representations from Transformers BERT: Pre-train...
前言 走過了資料分析、演算法選擇後,我們得知了有些可以改善模型的方向: 解決資料不平衡(Done) 學習率的設定(Done) 訓練輪數(Nice to hav...