iT邦幫忙

2022 iThome 鐵人賽

DAY 16
0

今天我們要來探索新插件!又是個實作日了,準備好,我們就開工啦~/images/emoticon/emoticon37.gif

安裝並重新開啟

首先,我們至Orange上的工作列表點選「Options」,再來點選其中最下面的「Add-on(插件)」,打開之後將會看到許多插件可勾選安裝,而這次我們要先來看看「Bioinformatics(生物資訊)」,勾選後按下OK鍵,就會開始下載了。
https://ithelp.ithome.com.tw/upload/images/20220930/20151063QdcWpOyrtr.png

完成後,將會看到此提醒訊息,當中意思就是因為Orange剛安裝好一個插件,所以需要重新啟動此程式,此時我們按下OK鈕後,即可再重新打開Orange了!

https://ithelp.ithome.com.tw/upload/images/20220930/20151063OVgrtioRaJ.png

開啟後就會看到它出現在旁邊列表囉~

https://i.imgur.com/yTjnvrO.gif

引用插件中數據並將其可視化

再來,我們先用「GEO data set」中的數據來進行分析。

補充說明 : GEO(Gene Expression Omnibus)
基因表達資料庫是公共功能基因組數據存儲庫,為當今最大、最全面的公共基因表達數據資源。
https://ithelp.ithome.com.tw/upload/images/20220930/20151063uqkul0ipbK.png

這次以抽菸這個主題來探討,於搜尋列表中輸入smoking,便會跑出許多這類數據集,而這次選的是第三個數據集,可以從下表中看到,當中包含5個抽菸者,與另外5個非吸菸者。

https://ithelp.ithome.com.tw/upload/images/20220930/20151063M1HdMYNrpF.png

可點擊Data Table進行查看,會發現它以紅色代表為「不吸菸者」,而藍色為「吸菸者」。

https://i.imgur.com/Z4EQVWI.gif

而我們希望以可視化的方式,查看吸菸者與非吸菸者兩者間的基因是否有所差距,然而因為數據集中有著許多屬性,理解起來有些吃力,固然我們就將「MDS」這個可降維度的演算法來為我們效勞一下啦~它會把多維數據投影到二維空間!

https://ithelp.ithome.com.tw/upload/images/20220930/20151063dR7oahRXr4.png

我們可以從這裡看到有一個特別突出的數據點,是一位吸菸者,雖然我們並非生物學家,但也可以了解到吸菸會對於細胞造成影響。

https://ithelp.ithome.com.tw/upload/images/20220930/20151063ZtbifyuhHd.png

好哩~今日的簡單實作就到這了,在下一次的實作也會用到有關降維的組件喔!敬請期待~/images/emoticon/emoticon07.gif

參考資料:
Orange
帶你認識GEO資料庫


上一篇
〔Day15〕數據也可以降維?-MDS
下一篇
〔Day17〕聊聊另一個經典降維演算法-PCA
系列文
一同來挖掘 0 程式的Orange!30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言