大數據、AI 是這幾年的熱門議題,不管是公司還是客戶都會開始透過資料分析或機器學習來改善自家產品或業務。但是這幾年走下來不管是自己公司還是客戶,在這個資料專案的開發以及管理上也是一直跌跌撞撞。為了讓大家能夠跳過或閃開曾經踩過的坑,這一系列文章會從資料產品的專案管理面著手,來介紹曾經遇過的那些坑。用了一個大家很陌生的標題當開頭,自己也是第一次整理這個主題,希望能夠順利完賽!
資料產品是一個非常新的概念,我們先來個別釐清一下:
在談資料之前,我們先聊聊「資訊」(https://zh.wikipedia.org/zh-tw/%E4%BF%A1%E6%81%AF)
生活中基本上就是充滿各種資訊,可以以各種形式出現,像是有形的天氣、溫度、重量;無形的認知、概念、經驗等等。維基百科有一句說得非常好,「資訊可以減少不確定性」。透過搜集資訊,可以讓我們產生對於世界的認知、判斷外在環境的狀況、甚至預測未來可能發生的事情。
資料可以說是資訊的具體化。例如我們通常都是靠皮膚來判斷外在溫度的高低,這時候還只是資訊;但當我們透過溫度計量測氣溫、並將之記錄下來就變成了資料。這些資料在現代科技上通常都會被儲存在電子產品上(不論是硬碟、Ram、還是磁帶),大家就可以利用電腦來存取這些資料並加以運算。
產品根據維基百科的定義是「滿足人們需求或慾望的有形或無形的載體」。從這些定義上來看,資料是資訊的載體,而資訊可以用來幫助人們減少不確定性,因此資料產品的定義就是「可以用來幫助人們減少不確定的東西,這東西是由資料或資訊所構成」。
現代人大量依賴使用資料來做決策,而根據資料被加工的程度分別,我們可以將資料產品分為五種層次。
資料產品的特性在於需要循序漸進的處理,就像要做法國料理中的米蛋糕,還是需要先從基本的原料-稻米開始處理,無法跳層。如果要做模型(第三層),需要先做第一層的原始資料開始搜集、接著根據模型需要的特徵值將資料轉換。
之後我們會陸續介紹各層資料產品類型的案例,讓大家能更深入的了解資料產品。
https://www.coursera.org/learn/data-products
https://medium.com/@itunpredictable/data-as-a-product-vs-data-as-a-service-d9f7e622dc55
https://www.linkedin.com/pulse/what-does-mean-manage-data-product-martyn-sukys/
https://hbr.org/2018/10/how-to-build-great-data-products
https://towardsdatascience.com/designing-data-products-b6b93edf3d23