iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 18
0
自我挑戰組

When Bioinfo met Julia: Bioinformatician的30天Julia學習之路系列 第 19

[Day 18] 分析Copy number variation系列(參)

昨天介紹了分析Array-based資料當中CNV的一種方法

所以今天就不意外地要介紹一下目前用來分析NGS資料當中CNV的方法了!根據Computational tools for copy number variation (CNV) detection using next-generation sequencing data: features and perspectives這篇論文所提到的,一般來說,用在NGS data上找CNV的方法大概可以粗分為五大類:

  1. Paired-end mapping (PEM): 這種方法是根據檢查paired-end reads之間的距離(inner distance)是否顯著與平均的距離不同,來判斷CNV。
  2. Split read (SR): 這種方法利用每一對read pair的incompletely mapping來判斷是否有small CNVs。
  3. Read depth (RD):顧名思義就是利用了比較比對上每一個genomic region上面的reads數量來做判斷。
  4. De novo assembly of a genome (AS):這個方法就概念上來說我還蠻喜歡的,它先將所有的reads透過de novo assembly組裝成contigs之後來跟reference genome做比較,來判斷CNVs。
  5. Combination of the above approaches (CB):主要是同時運用了PEM跟RD兩種方法來判斷CNVs。

CNVdetection

但是就我自己看到目前為止,絕大部分的新工具或是新方法幾乎都是read-depth-based不過我還是順便附上一下我自己在寫這一篇的時候所蒐集到的CNV tools資訊連結,附帶一提的是根據今年發表在American Journal of Human Genetics的一篇文章表示,目前大約有超過五十種不同的CNV-calling方法,其中被引用最多的一個也不過只佔了不到12%的引用量,加上這些不同方法所得到的一致性不是很高,因此真要說找一個極具代表性的工具還真的是沒辦法。

  1. PEM:
  2. SR:
  3. RD:
  4. AS:
  5. CB:

目前文獻中,一般比較推薦的分析流程如下:

pipeline


上一篇
[Day 17] 分析Copy number variation系列 (貳)
下一篇
[Day 19] 分析Copy number variation系列(肆)
系列文
When Bioinfo met Julia: Bioinformatician的30天Julia學習之路32
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

0
杜岳華
iT邦新手 5 級 ‧ 2018-10-19 22:59:50

我要收藏了XD

我要留言

立即登入留言