iT邦幫忙

2022 iThome 鐵人賽

DAY 16
0
AI & Data

16S rRNA 從次世代到三代定序-生資QIIME2資料分析趣系列 第 16

[Day 16] NGS QIIME2 : 分析與繪製組內物種多樣性 (Alpha diversity) (上)

  • 分享至 

  • xImage
  •  

情境 : 森林裡的樹木多樣嗎?

假設你走路走著撞見了一片森林,
想知道森林中樹種多樣化程度,要如何進行量化分析呢?

在生態學角度,
「多樣」這件事情可以分成
物種豐富度 (Species richness)、物種均勻度 (Species evenness) :

  • 物種豐富度 指的是物種的數量,數量越多豐富度越大。
  • 物種均勻度 指的是群集(community)中物種數量的分配情況,
    物種彼此數量越接近,均勻度越高。
    Reference : 科學 Online

森林1森林2 進行比較,
兩者物種豐富度 相同,都是16顆樹,
森林1 4個不同物種數量接近(均勻),物種均勻度 森林1 > 森林2 :
https://ithelp.ithome.com.tw/upload/images/20220914/20151510DXvORmgssn.jpg
Reference : bioninja

回到分析,每個組裡面的物種(菌相)多樣嗎?

我們把森林1、森林2... 想像成範例檔案中 FemaleMale 兩組,
想知道女性與男性組內的菌相多樣性如何? 並量化成數字做成圖

我們可以用 組內多樣性 Alpha diversity 找到答案,
「組內」指的是樣本內的意思,觀察樣本內的多樣性情況,
QIIME2 提供三種指數進行計算 (嗅到生物統計學的味道了 :

  • 物種豐富度指數 (Species richness)
  • 物種均勻度指數 (Species evenness)
  • 物種多樣性指數 (Diversity index)

並提供兩種視覺化呈現方式 :

  • 稀疏曲線 (Rarefaction curve)
  • 箱形圖 (Box plot)

先把程式跑完,後面慢慢解讀~

  • 繪製多樣性分析 (Alpha and Beta diversity)

    先啟動 qiime2-2022.8 環境
    conda activate qiime2-2022.8

    會使用到rooted-tree.qzatable-dada2-240.qzasample-metadata.tsv
    帶上[Day 15] 的便條紙,這邊要告訴 QIIME2 最大的序列條數是多少 :

    qiime diversity alpha-rarefaction \
      --i-table table-dada2-240.qza \
      --i-phylogeny rooted-tree.qza \
      --p-max-depth 50131 \
      --m-metadata-file sample-metadata.tsv \
      --o-visualization alpha-rarefaction.qzv
    

    --p-max-depth : 可視為所有樣本中,最大的序列條數

    完成後會顯示 :

    '
    Saved Visualization to: alpha-rarefaction.qzv
    '
    

    同一張便條紙,這邊要告訴 QIIME2 統計的取樣深度是多少 :

    qiime diversity core-metrics-phylogenetic \
      --i-phylogeny rooted-tree.qza \
      --i-table table-dada2-240.qza \
      --p-sampling-depth 19914 \
      --m-metadata-file sample-metadata.tsv \
      --output-dir core-metrics-results    
    

    --p-sampling-depth : 取樣深度
    --output-dir : 輸出的資料夾,若原本無此資料夾會自動創一個,
    因為此次產出檔案眾多,用一個資料夾裝他們。

    完成後會顯示 :

    '
    Saved FeatureTable[Frequency] to: core-metrics-results/rarefied_table.qza
    Saved SampleData[AlphaDiversity] to: core-metrics-results/faith_pd_vector.qza
    Saved SampleData[AlphaDiversity] to: core-metrics-results/observed_features_vector.qza
    Saved SampleData[AlphaDiversity] to: core-metrics-results/shannon_vector.qza
    Saved SampleData[AlphaDiversity] to: core-metrics-results/evenness_vector.qza
    Saved DistanceMatrix to: core-metrics-results/unweighted_unifrac_distance_matrix.qza
    Saved DistanceMatrix to: core-metrics-results/weighted_unifrac_distance_matrix.qza
    Saved DistanceMatrix to: core-metrics-results/jaccard_distance_matrix.qza
    Saved DistanceMatrix to: core-metrics-results/bray_curtis_distance_matrix.qza
    Saved PCoAResults to: core-metrics-results/unweighted_unifrac_pcoa_results.qza
    Saved PCoAResults to: core-metrics-results/weighted_unifrac_pcoa_results.qza
    Saved PCoAResults to: core-metrics-results/jaccard_pcoa_results.qza
    Saved PCoAResults to: core-metrics-results/bray_curtis_pcoa_results.qza
    Saved Visualization to: core-metrics-results/unweighted_unifrac_emperor.qzv
    Saved Visualization to: core-metrics-results/weighted_unifrac_emperor.qzv
    Saved Visualization to: core-metrics-results/jaccard_emperor.qzv
    Saved Visualization to: core-metrics-results/bray_curtis_emperor.qzv
    '
    

    沒錯,就是這麼多,跑出了滿滿的統計圖,真的是很方便。


本篇使用到的輸入/輸出檔案 :
Input : table-dada2-240.qza、rooted-tree.qza、sample-metadata.tsv
Output: alpha-rarefaction.qzv、core-metrics-results (folder)

下回是多樣性統計解讀時間!


上一篇
[Day 15] NGS QIIME2 : 統計分析前樣本的取捨 - 取樣深度 (Sampling depth)
下一篇
[Day 17] NGS QIIME2 : 分析與繪製組內物種多樣性 (Alpha diversity) (下)
系列文
16S rRNA 從次世代到三代定序-生資QIIME2資料分析趣33
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言