今天來介紹文字模型常用的文字特徵-TFIDF,我們透過堆積木的方式,來說明文字特徵的設計。
1. TF(Term Frequency)
TF全名是Term Fr...
“baby-llama2-chinese”是一個用於從頭開始預訓練加上SFT的小參數量中文LLaMa2的倉庫。該專案的目的是創建一個能夠流暢進行中文問答的cha...
這系列文將會分享自己在過去幾年 Applied Data Scientist 的工作經驗,隨著團隊不斷擴大,如何去建構一個和其他 Data Scientist...
主要架構
階層分析架構
語法分析(Syntactic Analysis):利用語文法則去瞭解一個句子內,詞與詞之間應該有的正確順序、組合,與其一定程度遵守的「...
資料類型-數值型、類別型
數值型資料:以數值存在、能做數值運算的資料。如身高體重、年齡、收入……等。
類別型資料:用來描述事物的屬性或特徵。如性別、尺寸、地區...
前言:現代人講求效率,不再閱讀龐大繁雜的文字資料,而俗話說:「一張好的圖要讓人三秒就能理解。」資料視覺化,透過圖表來說明資訊和資料,在這邊我們也可以用視覺化幫助...