iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 3
0
AI & Data

人本資訊資料探勘系列 第 3

認識資料、了解資料

  • 分享至 

  • xImage
  •  

在昨天寫完有關資料的故事
接下來更深入了解一下資料


Data set:
常見的 Data set 有 Record, Graph, Ordered, multimedia
而資料的結構又有 Dimensionality(維度)、Sparsity(稀疏性)、Resolution(解析度)及 Distribution(分散性)
Data set 的組成由多個 Data object 所構成,每個 Data object 都象徵著一個獨立個體
其中 Data object 又由不同的 attributes(屬性) 所表達

Attributes:
屬性,可能是該資料的「維度」、「特點」或「變量」
種類也可能有 Nominal, Binary, Numeric
Nominal 為一種敘述該資料的說明:如「黑色」頭髮、「紅色」汽車
Binary 則表示該資料的 Nominal 只有「0」或「1」兩種屬性
Numeric 則表示一個數據的區間,如溫度等


接下來進入複習高中數學:
(x 表示一個數組,n 則為數組 x 長度)
Mean 平均:
https://ithelp.ithome.com.tw/upload/images/20190911/20120250zzTcTF6BXR.png
Median 中位數:
https://ithelp.ithome.com.tw/upload/images/20190911/20120250L928DPSkFz.png
Mode 數組中頻率最高的值:
https://ithelp.ithome.com.tw/upload/images/20190911/201202505ZnEuLOnn2.png


先這樣,明天再從線性代數開始


上一篇
KDD 又是什麼東西?有什麼意義?
系列文
人本資訊資料探勘3
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言