在前兩天的文當中,我分別介紹了應用在SNP array及NGS資料上的CNV-calling方法,今天就來看看如果我想使用julia底下的工具來達成這個目標是否有可能。
在BioJulia及OpenGene裡頭雖有幾個Packages稍微與CNV-calling有關,但僅僅是Fasta/Fastq、BED/VCF之類檔案的讀寫,像以下這些:
先來看看CNV-calling的步驟,根據Biostars上面的某篇討論文章中所提到的CNV-calling的流程中,在還沒涉及到演算法的部份,主要可以分為三個部份:
經過我認真找了一下之後,我找到了這些工具:
第一個工具採用的是一般BAM檔經pileup變成BCF檔再進行variant-calling的方式,中間同樣是使用前面介紹過的pipeline()
來完成操作。第二個工具則是利用串接不同的simulated data產生器及不同的variant callers,來比較其性能及結果。第三個工具則是支援對於SeqArray這種工具所產生資料的parser。
看來,想偷懶是不可能的。剩下近兩週的鐵人賽,只好自己跳下來寫了 T_T