根據維基百科中,對於資料的定義:「資料(英語:data),是指未經過處理的原始記錄。一般而言,資料缺乏組織及分類,無法明確的表達事物代表的意義,它可能是一堆的雜誌、一大疊的報紙、數種的開會記錄或是整本病人的病歷紀錄。(wiki: 資料)」
在知識管理的流程裡,泛指從資料到最終價值的四個資料流。「資料」是指未經處理消化的初級素材,「資訊」是將資料有系統的整理產生可用性的加工資料。「知識」是透過資訊及使用者的經驗產生價值的材料。「智慧」是知識管理的最上層,將知識轉化成創造效益及價值。資料科學其實也是以知識探索為目的的一種方法,如何將資料一層一層挖掘出有價值的知識。
前幾天提過了如何使用資料庫存放資料,今天來談談原始的資料是怎麼存在的呢?
CSV(Comma Seperated Values)逗號分隔值,是一種常見的資料格式,使用逗號將不同欄位做為分隔。可以使用一般的文字編輯器以原始格式開啟,也可以使用 excel 或 number 等試算表軟體以表格方式開啟。一般格式如下,第一列會記錄格式,第二列開始記錄資料:
JSON(JSON stands for JavaScript Object Notation)JavaScript 物件格式,是一種延伸自 JavaScript 物件來儲存和交換簡單結構的輕量級純文字資料交換格式。一般格式如下,每一筆資料都會用 "{資料屬性:資料數值}" 的格式紀錄,也可以是巢狀資料。
XML(eXtensible Markup Language)可延伸標記式語言,是一種標記式語言,處理包含各種資訊的資料等。