iT邦幫忙

2024 iThome 鐵人賽

DAY 27
2

前言


前一篇我們聊了推動資料決策文化的種種要素,希望沒有讓你決定打退堂鼓。

我想在2024年,資料科學已經算是一個比較成熟的工作領域了,在2017我剛畢業的時候,資料科學的概念可能在台灣才萌芽2-3年,因此很多公司也沒真正體會到資料的價值,才剛想跟隨一下潮流,找個資料科學家來變變魔術好了?

當時很流行一句話,相信大家都聽過:

“Big data is like teenage sex: 
everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it.”

在2018-2019 就出現了蠻多文章在說資料科學家們正在離職,其中原因其實放到現在也還蠻常見,我們今天就來回顧當時資料科學推動困難的原因。

資料科學初期推動的困難


1.現實與期待落差巨大


關鍵在於『缺乏可靠的資料來源、基礎建設』。

比較資淺的資料科學家在加入公司時,期待的、想像的每天工作是埋頭在數據探索、跑一堆統計模型、機器學習的模型,在做很多有趣的假設和驗證。

但大多數使用資料還在起步階段的公司,相對資料科學家而言,應該要找的是軟體工程師,或是資料工程師,因為他們還沒有足夠可靠的資料流,能提供資料科學家心無旁騖的做資料科學的專案。這也是為什麼在這30天的系列文章裡,我將資料工程的比重放的比較重,希望用較淺顯的方式,幫助資料科學家、分析師能掌握一些資料工程的基礎,不至於帶著失望離開。

資料科學家加入一個公司後,另一個常見的期待落差是『每天日常工作其實是寫SQL提供報表』。我曾經在社群帶過幾次mentee,後來mentee們陸續從學校畢業進到業界,大概三個月都會跑來問我,『我現在的工作都在寫SQL,要怎麼樣更有發展性?』我的回答都一樣,『寫SQL很正常,用什麼工具不重要,但重要的是你怎麼把時間擠出來去做你覺得更有價值的產出?』

我自己的經驗:將重複性工作模組化

在我剛加入公司的時候,資料分析師的工作有80%是撈數據產製給客戶的報表,但我大概花了三個月熟悉公司產品的所有資料表的關聯(MySQL 的基礎),透過 R 將 SQL 都參數模組化,還打包成一個 R Package,讓我的夥伴可以直接安裝使用。三個月後我幾乎80%的時間都可以拿來看 papers 做模型實驗研究。

2.職場的政治


有一篇文章《The most difficult thing in data science: politics》寫得蠻好的,很推薦閱讀。

『建立信任和影響力』是在團隊合作上最重要的事,建立很難,毀掉很簡單。

在剛加入團隊的時候,一定躍躍欲試迫不及待想做很多有趣的研究,但你可能會很挫折,在你埋頭苦幹終於用你覺得很先進的深度學習模型,跑出了一個很棒的實驗結果,準確率95%,但一位資深的PM問:『剩下的5% 怎麼辦?』,因此沒有採用你的方法。

更負面的案例是,你認為你做的是對的,事實上也是,但是你大吼大叫,搞的團隊烏煙瘴氣,覺得沒有人聽你的,無論你做的事多麽正確,你都失去你的正當性了。

所以在日常你其實需要不斷去做一些臨時的幫忙,建立人情,建立信任,強化你的影響力,尤其是那些在公司業務上較資深、具有實際巨大影響力的人,讓他們支持你,是一個很重要的關鍵。

我自己的經驗:

我一開始加入公司,把報表模組化了,開始有時間做研究了,對我自己的要求是每兩週產品衝刺結束後的Demo Meeting 都要跟全公司分享一個統計模型、機器學習模型,在我們產品可以怎麼應用的案例,但過了半年,我發現我做的研究都停留在當天的報告而已。

後來我放下手上的研究,放下『我想做的研究』,去了解其他部門夥伴到底在意什麼,也幫忙它們日常的工作優化,最後找到了一個問題『不雅暱稱』,當時玩家很愛取不雅暱稱來罷凌別人,這是一個產品真正在意的『問題』,於是終於用上了我研究許久的文字探勘模型來處理這個問題,也真的上線到產品,得到不小的成就感,也幫助產品變得更好!

3.你是資料 ATM


在一開始公司願意嘗試使用數據,也成立了數據部門,老闆也開始要數據,會出現一個現象:『資料分析師擁有存取所有數據的權限的唯一代言人』,不管大大小小的數據疑難雜症,大家都會來找你,我最高紀錄一天處理了快20個臨時的數據問題,你不是分析師,你只是個資料ATM。

最後你會沒有時間處理真正重要的資料建設、資料分析的專案,被瑣事淹沒。

我自己的經驗:

怎麼解決這問題呢?後來我從醫院急診室想到『檢傷分類』,所以我開始去分類資料需求,那真正臨時有資料需求的緊急傷患怎麼辦?所以設計了『資料診所』的概念,透過固定時段來解決臨時的數據需求,讓我能安排我的工作時間,也能解決大家的問題。

4.資料團隊運作孤立


在一開始成立資料團隊,或是一開始使用資料的時候,因為還沒有建立出信任和習慣,資料團隊會覺得非常的孤立,好像不屬於軟體工程師,業務部門也不知道怎麼開始和你協作,老闆可能也會一直叫你提出具體的產出,於是開始自顧自的提出解決方案,但單打獨鬥不會產生最好的價值的,資料科學團隊也得自己負起成敗責任,最後導致失敗。

所以如第二點,怎麼去建立出信任和影響力,找到一個能快速成功的小專案作為示範,讓其他部門依樣畫葫蘆,會是一個不錯的開始。

我自己的經驗:

其實和第二點一樣,放下『自己想做的研究』,去和業務部門、產品部門相處,甚至和高階主管有機會交流,找出組織內重要的問題、有核心人物在意的問題,與他們合作打造一個成功的小專案,並且尋求高層的支持,例如:在季度大會上面分享這樣的成功,讓更多夥伴們了解怎麼進行一個資料科學專案。

小結


推動新的文化、組織變革、打造新的工作流程是一件非常困難的事,並不僅限於資料科學,而在這過程中,你最需要的是政治能力,今天我們用 2018 資料科學家的故事聊了這樣一個新興領域出現,推動改變的心酸血淚,你需要有很敏銳的觀察力、能在不同角度思考的同理心,以及無私的奉獻精神,才能逐步建立信任和影響力,推動你相信的願景和改變,一起加油!


上一篇
打造資料驅動決策的文化
下一篇
資料診所: 資料分析師的時間救星
系列文
資料決策時代:從零開始打造公司數據引擎與決策文化30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言