學習資料庫就要先學習基本概念,像是資料與數據或是資料類型
資料:未處理過的事實或是概念,原始的資料
數據:經過處理的資料
但其實在大部分情況下資料與數據都在指真實世界中未經處理的事實,這些原始紀錄項目可能會以一種或數種形態同時出現像是:數值、文字,聲音以及影像
一般來說,資料可以分為結構化資料跟非結構化資料與半結構化資料
結構化資料:
- 遵循一定欄位、格式以及規則所呈現的資料通常運用在關聯式資料庫
- 關聯式資料庫的資料表是一種紀錄固定欄位的文數字類型,結構類似Excel表格,
- 列(row)稱為值組,欄位(column)稱為屬性
- 結構化資料需要用結構化查詢語言SQL查詢
- 在結構化資料上才可以做數據分析
非結構化資料:
- 形式自由且不遵循標準格式規範的一堆沒有組織的原始資料
- 沒有固定欄位也沒有固定格式
- 圖像、音頻、視頻
- 非結構化資料比結構化資料還要更多,體積也更大
半結構化資料:
- 有結構化和非結構化資料部分特徵
- 具有欄位但是內容格式不一致
- 非結構化資料需要透過非關聯式資料庫NoSQL處理
- JSON、XML
資料庫運作是透過一套資料庫管理系統(DBMS)來控制數據的儲存,組織和檢索,DBMS包含
- 核心程式
- 媒搭數據儲存庫
- 查詢語言
關聯式模型和關聯式資料庫
關聯模型來表達操作與管理資料的資料庫即是關聯式資料庫,用一種簡單的關聯來儲存數據稱為「表」,由組值集合而成,每個值組則是每筆資料的觀測值