2013-詞嵌入(word embeddings)
原先在NLP領域中主要是通過稀疏向量(SparseVector),在2001年,首次出現的稠密向量(Dens...
今天是第一天,而今日的任務是從Kaggle下載並導入一個數據集。首先,透過Kaggle的API下載了所需的數據集。接著,在java中Apache Commons...
斷簽我先哭
Pandas 是什麼?Pandas 是基於 Numpy 構建的資料處理庫,讓我們能夠處理大量的數據。它的核心數據結構是 DataFrame 和...
Q-Q Plot
利用 pingouin 套件中的功能來畫各個變數的 Q-Q Plot。pingouin 是一個開源的統計套件,其中有許多統計的功能,除了畫 Q...
K-means原理:K-means通過將資料點分配到距離最近的質心(centroid)來進行聚類。質心由聚類內資料點的平均位置決定。優點:簡單且計算效率高,適合...
在使用列表時,索引值必須是按照順序的整數:
>>> arr = [2, 3, 5]
>>> arr[2] = 7
>&...