iT邦幫忙

第 11 屆 iT 邦幫忙鐵人賽

DAY 26
1

綜合分析篇之總集編

來回顧一下短短的綜合分析篇學了什麼吧~

RNA-Sick@Day16 > 基因代號進得去,生物意義出得來,GO 發大財|基因本體論富集分析 feat. Gene Ontology (上)
RNA-Sick@Day17 > 基因代號進得去,生物意義出得來,GO 發大財|基因本體論富集分析 feat. Panther classification system (中)
RNA-Sick@Day18 > 基因代號進得去,生物意義出得來,GO 發大財|基因本體論富集分析 feat. REViGO (下)

  • 第 16, 17, 18 天,圍繞在基因本體論富集分析,這個分析通常緊接在轉錄體流程下游,註解、評分、視覺化,三步驟解析基因列表的生理調節意義!

RNA-Sick@Day19 > 快用你那無敵的非監督機器學習想想辦法吧|依據表現量特徵將基因分群 feat. MAPMAN (上)
RNA-Sick@Day20 > 快用你那無敵的非監督機器學習想想辦法吧|依據表現量特徵將基因分群 feat. K-means clustering (下)

  • 第 19, 20 天圍繞在 k-means clustering,用 MAPMAN 就可以不寫程式完成基因分群,但是了解分群演算法以及資料型態的多變之後,也可以考慮寫點程式嘗試一下不同的分群方式~

RNA-Sick@Day21 > 是擅長畫 Pathway 的朋友啊|用程式來查京都基因與基因體百科全書 feat. KEGG REST API
RNA-Sick@Day22 > 誰能阻止少年專題生呢?他們聽不到|用程式上 NCBI 資料庫 feat. NCBI Entrez

  • 第 21,22 天的隱藏主角是 BioPython,程式化地存取線上 KEGG, NCBI Entrez 綜合資料庫,整個更加賽博格~

RNA-Sick@Day23 > 基因調控什麼的最喜歡了|啟動子區段序列之順式作用元件分析 feat. PLACE database
RNA-Sick@Day24 > 關於資料視覺化,我想說的是|用 python 繪製充滿特色的圖表 feat. seaborn

  • 第 23, 24 天,以會影響基因調控的序列:啟動子作為分析主題,示範如何活用斷詞辨識前人建置的 PLACE 資料庫以及 Seaborn 函式庫的設定畫出獨一無二的資料視覺化圖。

RNA-Sick@Day25 > 我念 HMMER,但是我朋友都念 HMMER,聽說正解是HMMER|基於隱藏式馬可夫鍊的超強序列比對軟體 feat. HMMER3

  • 第 25 天混水摸魚過去,因為 HMM 實在太深奧,直接使用 HMMER 來體會他的強大吧~

HMMER 通常是在 genome-wide 的轉錄因子基因家族搜尋中使用,找出所有的轉錄音子基因家族成員之後,通常會在用 motif 軟體偵測一遍這些序列上還有沒有其他我們沒有檢查到的功能區段,這時候就會使用到 MEME 這軟體。

迷因套裝 (The MEME Suite)

The MEME Suite 也是有自己的 MEME 宇宙的那種套裝軟體,但是我們通常只會用到 Motif Discovery 的功能。

MEME 的中心思想,就是不需要資料庫累積的背景知識,直接由輸入的每一條序列來看,其中是否有出現很眼熟的 pattern,達到一定門檻的話就會被認作是一個 motif 啦!上傳序列之後有一些基本參數要設定,其中 advanced 的參數建議也要設定一下,比較重要的大概就是一段序列中可不可以出現重複的 motif、最大的 motif 可以多長、總共要找到多少個 motif,這三個對結果的影響頗大,要畫出好的圖可能需要下一番功夫調教合理的參數,因此是可以從分析結果看出研究者是隨便丟序列隨便拿圖來講、還是真的有概念要找出生物意義~

輸出結果會自動被丟進 MEME Suite 中的 MAST,從 MAST 的結果最方便作為後續的研究繪圖調整~

輸出的網頁介面可以進行互動式的序列檢視,十分方便,但是 MEME 存取我們上傳的分析有時間限制,建議盡快另存網頁下來,後續檢視與近一步分析比較方便!

偵測完之後,每一段 motif 都只有一個代號,建議還是要透過序列比對來指定出究竟哪一段是已知的功能區段~

如果有什麼實際使用的問題,或是想要知道調教參數的密技,請留言告訴我~

參考資料與延伸閱讀

http://meme-suite.org/

關於作者

謝晨 (Chen Hsieh),臺大園藝暨景觀學系研究所碩士。讀碩士前的興趣是懷著寫點程式妄圖解決農業問題的夢想參加比賽,拿了幾個黑客松與 Open Data 創新應用競賽的獎,卻都沒有勇氣將項目經營下去;研究所期間的興趣轉換成讀學術期刊的出刊電子報。靠著這些興趣當選 107 學年的臺大優秀青年,畢業後卻成了無業的實驗室居民。現在在農場旁的研究館辦公室寫點東西,希望可以跟世界分享生物資訊與園藝的樂趣!

感謝選擇匿名的朋友協助校閱初稿與提供意見,也敬請各位讀者不吝指教!

E-mail

Facebook

Twitter

Linkedin

RNA-Sick.me


上一篇
RNA-Sick@Day25 > 我念 HMMER,但是我朋友都念 HMMER,聽說正解是HMMER|基於隱藏式馬可夫鍊的超強序列比對軟體 feat. HMMER3
下一篇
RNA-Sick@Day27 > 嘴巴說可以,身體卻一點也不老實啊|程式碼筆記本保證研究可再現性 feat. NextJournal
系列文
猶豫就會敗北,果斷就會白給|園藝 boy 的生物資訊冒險記趣,跟上學術潮流不走冤望路 feat. RNA-Sick30

尚未有邦友留言

立即登入留言