在網路之上的多個伺服器節點建立了個巨量儲存空間和高吞吐(Throughput)的檔案系統,使用時無須關心檔案的物理儲存方式,可以像使用本地檔案系統一樣管理檔案及資料夾。
是 Hadoop 「數據生態圈」的重要基礎設施:
* 具備「故障檢測和隔離(Fault Detection and Isolation, FDI)」能力
* 透過資料「副本機制」獲得了更好的容錯能力
* 適合大型檔案以及巨量資料的批次處理
具有一些明顯的限制:
* 採用一致性模型有較高的讀寫延遲
* 不適用用於即時性服務
* NameNode 可能會造成單點故障