iT邦幫忙

0

【類神經網路】應用場景常見的初級問題

  • 分享至 

  • xImage
  •  

大家好,很高興見到大家。在此發個文,來解決我新手上路無法回文的問題哈哈,需要解決新手任務。很高興能參與到 IT 的社群,如果有在使用 IThome 有什麼小技巧或是什麼的,請不要介意的和我分享,我還在學習,是個菜鳥,感謝大家。


今天想和大家分享的事情是關於類神經網路中關於監督式學習的部分,一般來說,我們在訓練類神經網路的時候,會把資料分成輸入資料與標籤資料,透過模型訓練讓輸入資料經過模型計算後的輸出值,能和標籤資料匹配。這個方法在普遍多數類神經網路運用很成功的地方,大概都沒有什麼問題,例如影像辨識、圖像識別都是熱門的主題。

但是如果我是一般人,我想建立一個使用類神經網路的事業,不想處理這麼上游的純技術,而是想用簡單的技術整合到現存的一些業務流程中,例如我舉個例子:

你現在是一個商業機構顧問,你想改善一家公司的銷售流程,讓他們針對真正賺錢的商品做銷售就好,所以你想用類神經網路模型對客戶的消費資料進行訓練,希望讓他能匹配這個客戶購買的商品,藉此找出客戶在什麼樣的背景或前提最容易去購買某項商品。

初級問題1

好,所以你的類神經網路模型的資料主要會有:

輸入資料:一群客戶的消費背景資料,例如在什麼時間、在哪家店,這個客戶幾歲、性別是什麼。
標籤資料:一群客戶的消費明細資料,最終買了哪些東西、價格多少。

假設你很成功順利地訓練出了類神經網路模型,只要你輸入一個客戶的背景資料,他就會吐給你一個可能會買的東西、買的價格大概是多少,好,所以?

所以,你就要等新的客戶來到某一家店消費,然後計算他們可能會買的東西和價格,然後叫客戶常去的店進貨。

你有注意到任何不對勁的地方嗎?

當客戶到店裡面的時候,他已經消費了,他可能已經買了你預期他要買的東西,不然就是買了不是你預期他要買的東西,而不是還沒買東西!你的店根本來不及進貨。

很多人在想整合類神經網路的技術到真實應用場景的時候,經常會忽略這個問題,而這個問題還只是應用場景最低等級的問題,也就是真實應用場景的資料是【輸入與標籤,成對出現】你雖然很聰明地把資料按照很合理的方式分割成了輸入資料和標籤資料,但是你面對的情況卻是標籤資料和模型輸出資料同時出現的情況。

讓我們暫且稱「輸入與標籤,成對出現」叫做初級問題1,未來有機會我們會探討這個問題,還有怎麼解決,金融市場資料就是這樣。

初級問題2

你可能很聰明,所以你現在將輸入和標籤資料做了一個「時間延遲」使得你的預測能有反應時間,我得肯定這的確是初級問題1的解法的一種:

輸入資料:一群客戶的消費背景資料,他過往的消費背景,住哪裡、性別和電話之類的。
標籤資料:一群客戶的消費明細資料,但是是「下次」的消費,下次買了什麼、下次買了多少錢之類的。

假設你很順利的客戶大概都會來消費兩次以上,所以你至少都有客戶兩次的消費紀錄,使得你能做這樣子輸入、標籤資料的分類然後再訓練模型,我們假設你很成功地訓練出了一個模型,他能在客戶消費背景資料一輸入的當下,立即計算他下次可能要買的東西或買多少錢,可能要等多久他才會來買。

現在的問題是,假設模型計算這個人下次消費的時間是兩周後,預測他可能要買兩包蘋果好了,所以你什麼時候要進貨呢?你現在就要叫貨了嗎?但你現在叫貨的話,蘋果可能會壞掉哦!但是你現在不叫,他如果提前來買怎麼辦?所以我必須要十分確定這個人,他真的兩周之後會來買蘋果!

所以我需要資料中,必須有多次他兩周之後買蘋果的資料!
我必須要在統計上達到顯著,啊哈我統計可是學很好呢,學以致用呢!

有沒有再次發現不對勁的地方呢?

實務上你很有可能沒有辦法達到統計上的顯著性,因為當你把輸入和標籤資料中做了「時間延遲」的時候,你在應用場景中就多了「延遲的不確定性」因為你期望輸入與標籤之間要有因果關係,然而標籤的出現又要讓你有足夠的反應時間,因此你想找出來的因果關係,之間的時間就會拉長,你就越難保證真的是這個因導致這個果(而且事實上他可能還未必具有因果關係呢)。

讓我們暫且稱這個叫做「時間延遲的不確定性」也就是初級問題2,未來有機會我們也會談資料怎麼輸入和放標籤,來解決這個問題。


圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言