在昨天寫完有關資料的故事
接下來更深入了解一下資料
Data set:
常見的 Data set 有 Record, Graph, Ordered, multimedia
而資料的結構又有 Dimensionality(維度)、Sparsity(稀疏性)、Resolution(解析度)及 Distribution(分散性)
Data set 的組成由多個 Data object 所構成,每個 Data object 都象徵著一個獨立個體
其中 Data object 又由不同的 attributes(屬性) 所表達
Attributes:
屬性,可能是該資料的「維度」、「特點」或「變量」
種類也可能有 Nominal, Binary, Numeric
Nominal 為一種敘述該資料的說明:如「黑色」頭髮、「紅色」汽車
Binary 則表示該資料的 Nominal 只有「0」或「1」兩種屬性
Numeric 則表示一個數據的區間,如溫度等
接下來進入複習高中數學:
(x 表示一個數組,n 則為數組 x 長度)
Mean 平均:
Median 中位數:
Mode 數組中頻率最高的值:
先這樣,明天再從線性代數開始