2023 iThome 鐵人賽
帶我們前進的 是想證明自己的力量
AI & Data
選手 121 文章 2526
Day 15
2023-09-30
880
0
今天來介紹文字模型常用的文字特徵-TFIDF,我們透過堆積木的方式,來說明文字特徵的設計。 1. TF(Term Frequency) TF全名是Term Fr...
Day 6
2023-09-07
880
0
“baby-llama2-chinese”是一個用於從頭開始預訓練加上SFT的小參數量中文LLaMa2的倉庫。該專案的目的是創建一個能夠流暢進行中文問答的cha...
Day 1
2023-09-05
879
0
這系列文將會分享自己在過去幾年 Applied Data Scientist 的工作經驗,隨著團隊不斷擴大,如何去建構一個和其他 Data Scientist...
Day 26
2023-10-11
878
0
主要架構 階層分析架構 語法分析(Syntactic Analysis):利用語文法則去瞭解一個句子內,詞與詞之間應該有的正確順序、組合,與其一定程度遵守的「...
Day 17
2023-10-02
878
0
資料類型-數值型、類別型 數值型資料:以數值存在、能做數值運算的資料。如身高體重、年齡、收入……等。 類別型資料:用來描述事物的屬性或特徵。如性別、尺寸、地區...
Day 24
2023-10-06
876
0
前言:現代人講求效率,不再閱讀龐大繁雜的文字資料,而俗話說:「一張好的圖要讓人三秒就能理解。」資料視覺化,透過圖表來說明資訊和資料,在這邊我們也可以用視覺化幫助...