iT邦幫忙

DAY 1
5

成為資料工程師最初的 28 堂課系列 第 1

成為資料工程師最初的 28 堂課

要能夠掌握 Big Data, 以現在的說法就是成為資料科學家(Data Scientist), 而要成為資料科學家, 不只要對統計等數學有一定的熟悉度, 也要對企業等相關領域有一定的掌握, 再加上有實作的能力, 也就是對電腦領域有一定的能力, 這三種能力都要具備, 才能成為一個好的資料科學家.

上面兩張圖大概是兩種最常見的定義, 不同的地方就是一個是把專業專成聚焦成 "商業邏輯", 一個是把資訊科學 (Computer Science) 擴大成 "Hacking Skill (實作能力)", 事實上右邊是較為廣泛的定義. *1, *2

但說到這樣, 對大多數的人還是相當模糊的, 要如何成為一個好的 Data Scientist 資料科學家到底要會那些東西, 難道會跑 SASS 不就是一個好的資料工程師嗎? 當然沒那麼簡單, 事實上要成為上面三種領域的任何一種領域的專家已經不是那麼簡單了, 且要同時成為三種領域的專家是談何簡單.

雖然說是很難做到, 但我們真的應該是要嘗試去接近 Approach 這個目標, 而不是看了就放一旁, 透過這個鐵人賽, 我大概嘗試著開書單與課程, 讓大家了解只要認真的學習, 這目標是相當明確而不是做不到.

只是這應該是 14 堂課講不完的, 事實上若是真的講完還寫不了 30 天阿, 所以扣掉引言與結論, 剛好有 28 天, 所以就仿效 "最後 14 堂星期二的課", 來寫成 "成為資料工程師最初的 28 堂課", 所以大家可以準備拉椅子吧....

在還沒有開始, 我先引用國外有一個人寫 "Big Data Engineer" 的特質: *3

資料工程師是一個能夠掌握資料架構, 開發以及應用的工程師, 其中包含幾種能力:

  1. 他在軟體工程有足夠的經驗處理大量資料
  2. 他能夠擁抱每天數以 TeraBytes 進來的資料挑戰
  3. 他能夠開發複雜的 Big Data 計劃, 其中包含收集, 處理, 儲存, 分析, 呈現等等環節

除外, 更能夠:

  • 享受解決複雜問題的挑戰
  • 擁有很好的寫作與溝通能力
  • 能夠處理雲端運算環境
  • 跟同事與團隊合作且了解須求
  • 能夠協助處理模糊或衝突的文件
  • 能夠調較系統提升使用者經驗
  • 更能夠協調管理並解決困難的專案

這樣看起來跟本是個全才阿, 大家怕了嗎? 放心, 明天才開始第一堂課....

*1 左圖: http://www.zsassociates.com/solutions/services/technology/technology-services/data-scientist-services.aspx

*2 右圖: http://www.mitforumatlanta.org/events-listings/2015/data-science-10-1-14.html

*3 http://www.bigdata-startups.com/job-description-big-data-engineer/


下一篇
資料工程師第 1/28 課: 資料結構
系列文
成為資料工程師最初的 28 堂課30
0
肥龍
iT邦好手 1 級 ‧ 2 年前

朝聖
Big Data
不知前輩對資策會的Big Data的培訓班有什麼樣的看法

0
食夢黑貘
iT邦研究生 4 級 ‧ 2 年前

你可以嘗試看完我寫完這 28 堂課來做比較, 就不難想像出我的想法... 呵...

0
mis2000lab
iT邦好手 1 級 ‧ 2 年前

就算是簡單的程式設計課程,
都有人質疑這些大補習班的「培訓成效」了
例如這篇的留言 http://ithelp.ithome.com.tw/question/10157364

那麼,這些比較偏重「觀念式」的課程,真的能從補習班短期培訓成功嗎?
(尤其是學員沒有見過大型應用的時候,他們對於資料的Big or small,又怎麼區別呢?)

我也不太懂,只是想聽聽大家意見
也期待前輩這三十天文章,能讓我一窺堂奧。謝謝您

我要留言

立即登入留言