今天我們要來探索新插件!又是個實作日了,準備好,我們就開工啦~
首先,我們至Orange上的工作列表點選「Options」,再來點選其中最下面的「Add-on(插件)」,打開之後將會看到許多插件可勾選安裝,而這次我們要先來看看「Bioinformatics(生物資訊)」,勾選後按下OK鍵,就會開始下載了。
完成後,將會看到此提醒訊息,當中意思就是因為Orange剛安裝好一個插件,所以需要重新啟動此程式,此時我們按下OK鈕後,即可再重新打開Orange了!
開啟後就會看到它出現在旁邊列表囉~
再來,我們先用「GEO data set」中的數據來進行分析。
補充說明
: GEO(Gene Expression Omnibus)
基因表達資料庫是公共功能基因組數據存儲庫,為當今最大、最全面的公共基因表達數據資源。
這次以抽菸這個主題來探討,於搜尋列表中輸入smoking,便會跑出許多這類數據集,而這次選的是第三個數據集,可以從下表中看到,當中包含5個抽菸者,與另外5個非吸菸者。
可點擊Data Table進行查看,會發現它以紅色代表為「不吸菸者」,而藍色為「吸菸者」。
而我們希望以可視化的方式,查看吸菸者與非吸菸者兩者間的基因是否有所差距,然而因為數據集中有著許多屬性,理解起來有些吃力,固然我們就將「MDS」這個可降維度的演算法來為我們效勞一下啦~它會把多維數據投影到二維空間!
我們可以從這裡看到有一個特別突出的數據點,是一位吸菸者,雖然我們並非生物學家,但也可以了解到吸菸會對於細胞造成影響。
好哩~今日的簡單實作就到這了,在下一次的實作也會用到有關降維的組件喔!敬請期待~
參考資料:
Orange
帶你認識GEO資料庫