我們在第一天的鐵人邦就聊到了大數據,如今過了十幾天的一些資料分析概念和工具的介紹,讓我們回頭來看看數位時代轉型與大數據推進的精神與應用:
因為現代網際網路、行動網路、行動裝置的服務,可以直接對應到每一個個人,我們任何時候都可以透過這些服務滿足我們的需求,如想要中午去某間餐廳吃飯在網路上先訂位、吃飯時用餐廳的平板 APP 點餐、想買某樣商品在上班途中下訂單,許多過往要透過人工的動作,如今已能用相對快速的角度去生產出資料,需求也能夠客製化,數位化也能讓我們使用同樣工作時獲得不同方式的回應。以前的資訊系統要求高度一致化,而目前資料的異構性很高,在雜亂的訊息中要萃收斂為有價值的重點內容,是大數據的另一個挑戰。
之前聊過了 Big Data 的 4V:Volume, Velocity, Variety, Veracity,但這麼大量的資料,我們要怎麼「看」、怎麼去理解它?需要一定程度的 Visualize 視覺化,看氣象圖就是容易想像的例子,看到某區域第一團雲就會推測那個地方明天可能會下雨。既有的資料分析做法,大概找專業同仁及服務廠商,花 2 - 4 個月(有時候一不小心要半年)討論需求、開發系統、上線讓第一線工作人員使用,再花 2 - 4 個星期處理需求變更... 那如果有個工具能把現有資料整理成半成品,一有想法、做法需要調整,這個工具也能讓我們很輕鬆地操作,這樣是不是很理想呢?
Excel 在一定程度上,其實就能做到這樣的能力。但是當數據項目變多、資料湧進速度更快、內容質量參差不齊,在處理或決策上都會有不利的影響。而 Tableau 就是利用視覺化分析來看 Big Data,讓我們在大量、持續匯入的資料,能夠盡量即時地用初步圖表化方式去「查看」這些資料,而如果資料內含的資訊不足以提供作為判斷的依據(如有缺值,使用者客訴但沒寫原因,可能忘記寫、不爽寫,那到底要不要處理、適不適合處理?),分析過程中 Tableau 會試圖去找出這些資料可能代表的意涵(如果非常多人都客訴卻不寫原因,可能代表他們太生氣了,連寫理由都懶得寫),推理出幫助我們做決定的方向(收到客訴後,趕快找到這個客戶做溝通);透過累積的、已經發生的事情與紀錄,一步步往下面推敲,絕對的數字值配合視覺化的比例,再決定要調整、修正哪些想法與做法。當然,Excel 也能轉圖表,不過如果我們想要同時查看並匯總目前有多少人、客訴比例、客訴內容、客訴狀態、有沒有回覆... 等分散在各個紀錄模式與系統的內容,Excel 很難自動化地處理。而只要能進入系統做紀錄,Tableau 就能幫忙收納資料進來,一致地呈現資料可能可以告訴我們的意義,這是 Data-Driven 數據驅動的概念。
Tableau 視覺化資料分析有兩大構面,「建立分析」的 Tableau Desktop 與「共享資料」的 Tableau Server,網址如下:
https://www.tableau.com/