iT邦幫忙

2022 iThome 鐵人賽

DAY 26
0
AI & Data

16S rRNA 從次世代到三代定序-生資QIIME2資料分析趣系列 第 26

[Day 26] TGS pb-16S-nf : 結果圖檢視與取樣深度 (Sampling depth) 的調整

  • 分享至 

  • xImage
  •  

資料前處理、品質管制、物種分配的視覺化

pb-16S-nf 本身即整合 QIIME2 軟體緣故,所產出的圖檔幾乎相同,
本篇則先介紹資料前處理、品質管制、物種分配,
並提供該檔案路徑檔名,供讀者查閱 :

  • 資料前處理

    • 加工 (Artifacts) 壓縮後的概述 (Overview)
      • Overview 確認樣本名稱、數量與條數
        TGS_sewage/allResults/summary_demux/samples.demux.summary.qzv
        https://ithelp.ithome.com.tw/upload/images/20221008/20151510tMmvWZhNAk.png

      • Interactive Quality Plot 序列品質查看
        TGS_sewage/allResults/results/visualize_biom.html
        因 TGS Quality Score 過高 (>45 甚至 90 相當常見),
        使得 QIIME2介面的縱軸無法相容,
        在這裡會使用上述路徑做觀察 :
        https://ithelp.ithome.com.tw/upload/images/20221008/20151510hd7jXzzTHx.png

        還是可以偷偷看一下,會發現顯示報錯 :
        TGS_sewage/allResults/summary_demux/samples.demux.summary.qzv
        https://ithelp.ithome.com.tw/upload/images/20221008/20151510aD2ppkA2WU.png

    資料加工壓縮基礎解說 : [Day 07]

  • 品質管制

    若想試試啟動 QIIME2-2022.8 環境繼續手動分析往下做也可以 !
    其原始檔案(.qza) 位於 TGS_sewage/allResults/dada2/資料夾內。

  • 物種分配

    還記得[Day 23] 提到 pb-16S-nf 使用
    VSEARCH 與 Naive Bayes classifier 兩種分類器嗎?

    因此在物種分類結果上也會有兩種檔案可以參考,
    分析者可以觀察分類器的表現決定,也會發現其層級與NGS 二代分析相比,
    三代分析多數都能達到種 (Species) 層級 :

    • Naive Bayes classifier
      TGS_sewage/allResults/results/taxa_barplot.qzv
    • VSEARCH
      TGS_sewage/allResults/results/taxa_barplot_vsearch.qzv

    https://ithelp.ithome.com.tw/upload/images/20221008/20151510jHoXOlJA7n.png

    • krona.qzv
      TGS_sewage/allResults/results/krona.qzv
      https://ithelp.ithome.com.tw/upload/images/20221008/20151510t8lsTcF9vR.png

取樣深度 (Sampling depth) 的調整

pb-16S-nf 由於流程皆自動化的關係,
在稀疏曲線的取樣深度 (Sampling depth) 也交給了程式,
可在TGS_sewage/allResults/rarefaction_depth_suggested.txt 檢視程式給的值,
以範例檔案來說是 37867 ,經由檢視TGS_sewage/allResults/results/dada2_table.qzv後,
會發現有1個樣本被淘汰了 (意即剩3個樣本進入統計分析與繪製)。

若這樣的結果不是你想要的,如想全部保留,
可以使用--rarefaction_depth指令重新設定取樣深度 :

nextflow run main.nf \
--input TGS_sewage/manifest.tsv \
--metadata TGS_sewage/sample-metadata.tsv \
-profile conda \
--outdir TGS_sewage/allResults \
--dada2_cpu 32 \
--cutadapt_cpu 32 \
--vsearch_cpu 32 \
-resume \
--rarefaction_depth 32346

下回介紹群組的視覺化組別調整~


上一篇
[Day 25] TGS pb-16S-nf : 執行分析及結果頁面簡介
下一篇
[Day 27] TGS pb-16S-nf : 更改註釋資料 (Metadata) 的處理、熱圖與多樣性統計視覺化
系列文
16S rRNA 從次世代到三代定序-生資QIIME2資料分析趣33
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言