大數據的定義包含了這5個V。
Volume(大量):以過去技術無法管理的資料量,資料量單位可從TB(Terabyte,一兆位元組)到PB(Petabyte,千兆位元組)。
Variety(多樣性):企業的銷售、庫存的資料、網站的使用者動態、客服中心的通話紀錄、社交媒體上的文字影音…等企業資料庫難以儲存的[非結構化資料]。
Velocity(速度):每分每秒都在更新,技術也能做到即時儲存、處理,廣義的定義包括具備儲存、處理與分析這些資料的技術,以及能夠從這些資料中取出有用資訊的人才和組織。
Veracity(真實性):數據的準確度和可信賴度。
Value(價值):數據價值密度相對較低,或者說是浪裡掏沙卻又彌足珍貴,隨著互聯網以及物聯網的廣泛應用,資訊無處不在,資訊海量,但價值密度低,如何結合業務邏輯並通過強大的機器算法來挖掘數據價值,是大數據時代最需要解決的問題。