iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 14
0

關於昨天寫的Julia也可以用來分析RNA選擇性剪切一文

後來發現這系列不只有讀者,竟然還有response之後,今天就繼續來談一下Whippet.jl這個工具。首先得先說聲抱歉,最近由於想多花點時間陪陪家人,所以有時候一天能分給這個鐵人賽的時間就相對有限,也因此肯定會有很多地方沒談到。所以我非常歡迎,如果您有興趣,我們可以針對這個點繼續聊。

先談談昨天那篇論文的結果

  1. 昨天在看這篇文章的時候,看到作者說分析alternative splicing (AS)這種東西很花計算資源及運算時間,本來我還覺得有點大驚小怪的,畢竟我看之前待的公司同事在使用rMATs分析時,似乎也沒這麼誇張。直到我看到Outrigger之後,才發現這真是不簡單的東西XD

https://ithelp.ithome.com.tw/upload/images/20181015/20111688GLbo4p7jnx.png

  1. 作者們覺得過去的方法中,有些雖然能大幅降低計算時間跟所需計算資源了,但他們卻只能用在找比較簡單的AS(像intron-exon-intron這種),用來找比較複雜一點的AS(像下圖)就很不準了。
    https://ithelp.ithome.com.tw/upload/images/20181015/20111688XDod5BGakc.png

  2. 為了公平比較,作者們分別用實際跟模擬的Data以及不同的演算法工具來比較,用實際Data的部份,答案是根據RT-PCR的結果;模擬Data的部份,則是用參考基因序列加上外部工具及自己寫的工具產生模擬資料,結果顯示,Whippet這個演算法不僅錯誤率低,效能也好。
    https://ithelp.ithome.com.tw/upload/images/20181015/20111688sVlwGa7mS6.jpg

  3. 在贏得了與其他工具之爭後,作者們繼續拿Whippet去看看在正常組織中RNA的AS分佈與在腫瘤組織中的AS分佈有何不同。作者們發現,在腫瘤組織中所呈現的AS分佈顯示,複雜度高的AS events會比在正常組織中來的多。經過統計分析後,找到一些基因在腫瘤組織中其AS的數量顯著比在正常組織中的數量高很多,於是經過功能性分析(functional analysis)後,找出這些基因所對應的功能及所參與的生物功能路徑。

  4. 在更後續的研究中,作者們利用Whippet找到了更多的AS,同時也發現了裡頭有很多AS其實在演化上挺保守的,說明這些AS扮演著一定的重要功能。

關於Whippet.jl的使用

強烈建議直接使用 Julia v0.6,我自己這兩天過測試之後,如果不想自己跳下去改原作者的code的話,只有用0.6版的Julia才有辦法安裝。如果可以的話,在產生contiguous splice graph index的時候,盡量採用BAM + GTF的方式。

感謝閱讀。


上一篇
[Day 13] Julia也能用來分析RNA選擇性剪切耶
下一篇
[Day 15] 分析Copy number variation系列(零)
系列文
When Bioinfo met Julia: Bioinformatician的30天Julia學習之路32

1 則留言

0
魯大常
iT邦新手 5 級 ‧ 2018-10-25 17:19:29

請教一下在實際跑過那麼多 project 後,
Julia 在套件版本相容的問題會不會很麻煩?
或著說,他能有像 python 這樣的 virtual env 可以使用?

目前沒看過有類似python底下的pyenv或是virtual env這種東西,不過我自己會把這些吃不同版本Julia的套件用Docker去包 XD

docker呀,然後再學 Kubernetes 管理嗎(倒...

我要留言

立即登入留言