Manifold learning是目前比較熱門的一塊領域。
有時候資料在高維度空間中的分佈沒辦法使用線性的方法將他降維下來,即使降下來了也失去了重要的資訊。
這時候就會借用到數學的代數拓撲中流形的概念,他是在空間上任意光滑的形狀,可以用來近似任何表面或形狀的概念。
這樣講大家應該有聽沒有懂,看下圖
我們假設我們資料的分佈上原本是長像上面那個圖那樣,但是那樣的資料分佈無論用任何線性的方法都無法適當呈現資訊,而我們關注的會是他的形狀其實就像一塊捲起來的布,而這樣的布基本上可以用2維的空間去表示他,所以我們希望把他拉開看看資料的分佈是什麼樣子。
Manifold learning這類方法就是在高維空間中找到一個適合的流形將這樣的流形展開,就可以得到維度較低的資料了,這也就達到了降維的作用。
我後面會陸續介紹幾個這類的方法。
"代數拓撲中流形的概念,他是在空間上任意光滑的形狀,可以用來近似任何表面或形狀的概念。"
龐加萊笑了~ 只要你不挖個洞或撕裂它!
有洞真的很難處理阿XD