[Day 25] Dimensional Reduction -- manifold learning

2017 iT 邦幫忙鐵人賽

DAY 19

Big Data

我的資料科學之路系列第 25 篇

2017鐵人賽

杜岳華

2017-01-10 22:23:36

7793 瀏覽

分享至

Manifold learning是目前比較熱門的一塊領域。
有時候資料在高維度空間中的分佈沒辦法使用線性的方法將他降維下來，即使降下來了也失去了重要的資訊。

這時候就會借用到數學的代數拓撲中流形的概念，他是在空間上任意光滑的形狀，可以用來近似任何表面或形狀的概念。
這樣講大家應該有聽沒有懂，看下圖

我們假設我們資料的分佈上原本是長像上面那個圖那樣，但是那樣的資料分佈無論用任何線性的方法都無法適當呈現資訊，而我們關注的會是他的形狀其實就像一塊捲起來的布，而這樣的布基本上可以用2維的空間去表示他，所以我們希望把他拉開看看資料的分佈是什麼樣子。

Manifold learning這類方法就是在高維空間中找到一個適合的流形將這樣的流形展開，就可以得到維度較低的資料了，這也就達到了降維的作用。

我後面會陸續介紹幾個這類的方法。

[Day 24] Dimensional Reduction -- NMF

[Day 26] Dimensional Reduction -- MDS

系列文

我的資料科學之路共 34 篇

RSS系列文訂閱系列文

117 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

1 則留言

yuanshang

iT邦新手 4 級 ‧ 2017-01-12 18:15:09

"代數拓撲中流形的概念，他是在空間上任意光滑的形狀，可以用來近似任何表面或形狀的概念。"

龐加萊笑了~ 只要你不挖個洞或撕裂它!

回應 1
檢舉

杜岳華 iT邦新手 5 級 ‧ 2017-01-14 15:41:17 檢舉

有洞真的很難處理阿XD

登入發表回應

我要留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19860 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

趣味SQL 260224 時間區間重疊偵測與合併

IT邦幫忙

我的資料科學之路系列 第 25 篇