iT邦幫忙

2017 iT 邦幫忙鐵人賽
DAY 19
1
Big Data

我的資料科學之路系列 第 25

[Day 25] Dimensional Reduction -- manifold learning

Manifold learning是目前比較熱門的一塊領域。
有時候資料在高維度空間中的分佈沒辦法使用線性的方法將他降維下來,即使降下來了也失去了重要的資訊。

這時候就會借用到數學的代數拓撲中流形的概念,他是在空間上任意光滑的形狀,可以用來近似任何表面或形狀的概念。
這樣講大家應該有聽沒有懂,看下圖

我們假設我們資料的分佈上原本是長像上面那個圖那樣,但是那樣的資料分佈無論用任何線性的方法都無法適當呈現資訊,而我們關注的會是他的形狀其實就像一塊捲起來的布,而這樣的布基本上可以用2維的空間去表示他,所以我們希望把他拉開看看資料的分佈是什麼樣子。

Manifold learning這類方法就是在高維空間中找到一個適合的流形將這樣的流形展開,就可以得到維度較低的資料了,這也就達到了降維的作用。

我後面會陸續介紹幾個這類的方法。


上一篇
[Day 24] Dimensional Reduction -- NMF
下一篇
[Day 26] Dimensional Reduction -- MDS
系列文
我的資料科學之路34

1 則留言

1
yuanshang
iT邦新手 4 級 ‧ 2017-01-12 18:15:09

"代數拓撲中流形的概念,他是在空間上任意光滑的形狀,可以用來近似任何表面或形狀的概念。"

龐加萊笑了~ 只要你不挖個洞或撕裂它!

杜岳華 iT邦新手 5 級 ‧ 2017-01-14 15:41:17 檢舉

有洞真的很難處理阿XD

我要留言

立即登入留言