iT邦幫忙

2017 iT 邦幫忙鐵人賽
DAY 19
1
Big Data

我的資料科學之路系列 第 26

[Day 26] Dimensional Reduction -- MDS

今天講到最粗淺的MDS,他是Multidimensional scaling的縮寫。

他是做什麼的呢?
我們前面有提到,通常在探索資料的時候首先會用PCA的方式,以線性轉換的方式,找找看有沒有一些模式存在。
如果找不到,或許我們可以試試看MDS這個方法。

特性

這個方法最常用來視覺化高維度的資料,他會試圖保留高維度上點跟點之間的距離,然後將他映射在較低維度的空間上。
整體來說,他保留了整體性,但是映射到低維度的過程難免會對高維度的空間產生一些扭曲,見下圖。

中間的圖是原本的空間,經過MDS之後會變成右邊的圖,大家可以發現在立體空間中從某一個斜上方的角度就可以看到右邊的圖了,而右邊的圖看起來似乎少了深度的感覺,所以造成了視覺上的一些扭曲。
不過dimensional reduction難免會造成一些資訊流失就是了。

原理

首先要有個dissimilarity matrix,你可以把他想成distance matrix,主要就是要取得原本資料點之間的距離,而距離定義的方式有很多種,可以由使用者決定。
基本上他會把他映射到較低的維度上,而這個維度也是由使用者決定的,轉換到低維度上他會自動去找尋點的位置重新排列,而點的位置會依據上面給的distance matrix決定,而新維度上的距離會使用Euclidean distance。
映射的細節我並沒有非常了解,所以我沒辦法講,但是大致上的原理是這樣。


上一篇
[Day 25] Dimensional Reduction -- manifold learning
下一篇
[Day 27] Deep Learning -- 基礎
系列文
我的資料科學之路34
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言