我在剛開始工作時,公司讓一名很忙的工程師與我搭配。主管說:「你就開需求,看要收集什麼資料,讓工程師來收集吧!」
這是很標準的工程面的想法:確定需求、開發、驗收。
但是在分析數據時,我們其實是一直在嘗試各種錯誤:
也因此,在該名工程師完成第一版之後,我很快地提出第二版的需求。但是因為他也有許多其他重要的工作,而我卻無法肯定我的工作的重要性(大部分的想法其實是失敗的),所以很快地,我們的合作就無法滿足我的工作需求了:我只能一直等該名工程師有空的時間。短期的修正還好,但是一些大的更動,往往一等就是數個月。畢竟其他的需求都是確定性的需求,但是我這裡的需求往往是不確定效用的,所以權衡下來,就常常被擱置了。
這是我再次學到的一個教訓:資料科學團隊需要專屬的工程能量。
由於公司收購其他公司的緣故,因此人事被凍結,所以我只好捲起袖子,自己下來提供自己所需的工程能量。
從工程團隊來支援的角度來看,太多 try-and-error 的確跟做白工沒兩樣。
有專屬的工程能量是有高層鼎力支持的理想狀況,但一開始常常沒能這麼如意,多半是要做出些成果老闆才會投資。但一開始有誰願意來陪著一起兜圈子呢?而且若做出來的話,應該會把功勞歸在出想法的人,來幫忙實作的人可能拿不到太多credit。
所以做資料科學出想法的人多少還是要有一些實作能力,要不然會寸步難行啊。