iT邦幫忙

2021 iThome 鐵人賽

DAY 6
0
AI & Data

後端工程師的ML入門理解與Vertex AI系列 第 6

用題目找參數的困難 | ML#Day6

我們遇到了一些困擾與令人印象深刻的問題與經驗。

有個問題是這樣:先決定題目後再挖掘參數,還是看已有的參數有什麼去想像能做什麼題目?面臨到的是決定好題目但系統卻沒有關鍵性的參數,或者不知道什麼是決定性的參數。

沒有經驗的前提之下,兩種開始的方式都做了嘗試,然後好像並沒有一個標準答案,實作上發現都有困難的部分。

我們一張訂單會有幾十個欄位,如果全部採用會如之前介紹的,一下子處理幾十個維度,根本負擔不了,但若是只挑選寥寥幾個,這些欄位就能不能滿足我們的需求?

或者看著這幾十個欄位,我們團隊聚在一起,是否能討論出一個靈感,能夠發想出一個我們商業會在意的關聯關係,將某些重要欄位派上用場,作為我們的題目?

也許又或者選的題目太困難,參數才搞不定。

能夠只用少少的參數,怎麼發想出一個可以商業應用題目?重點就是「商業應用」,我們並非公司專屬的資料研究團隊(公司也沒有特別設立),成員背景基本上也都是純正的軟體工程師出身,如何提出一個能夠讓老闆點頭的題目,並且又在我們能力所及做得到的範圍進行?

所以在一來我們意識到原先定義的題目,有一些模糊和不確定的空間,以及所需參數(資料清洗能力)可能超出目前能力所及的考量之下,決定再次打掉題目。

新的題目必須限縮到更加地單純,能夠參考的參數大家也不會有太多的分歧意見,問題的情境和答案大家也都非常明瞭,盡量去除模糊的地帶之下,還能找出一個商業上或許能夠有參考價值的實作。


上一篇
模型有適用性 | ML#Day5
下一篇
特徵處理的概念 | ML#Day7
系列文
後端工程師的ML入門理解與Vertex AI30

尚未有邦友留言

立即登入留言