iT邦幫忙

2022 iThome 鐵人賽

DAY 14
0
AI & Data

16S rRNA 從次世代到三代定序-生資QIIME2資料分析趣系列 第 14

[Day 14] NGS QIIME2 : 繪製熱圖 (Heat map)

  • 分享至 

  • xImage
  •  

一目了然樣本與樣本間的差異

今天天氣晴朗 走輕鬆路線,
來畫一張大小朋友教授都愛的熱圖 (Heat map) (? :
https://ithelp.ithome.com.tw/upload/images/20220911/201515101cFV8iS4Zm.png

熱圖可以幫助判斷樣本之間的菌種豐富度分布,
能夠快速看出哪些是共同菌,哪些是一些樣本才有的菌種。

如果在 [Day 13] 有好好研究親緣關係樹 (Phylogenic tree) 的 iTOL 結果圖,
會發現許多特徵ID (Feature ID) 會對應到同一物種,
使得在結果圖上同一物種重複出現
但因為在親緣關係樹是以序列比對 (alignment) 角度出發,
強調的是序列的相似度(距離),是需要存在的結果。

而在熱圖中,會經歷兩個步驟,
先將對應到同一物種的序列進行合併(條數加總),
這過程 QIIME2 將其稱為折疊 (collapse)
再進行繪製。

Collapse : Collapse groups of features that have the same taxonomic assignment through the specified level. The frequencies of all features will be summed when they are collapsed.

  • 折疊 (collapse)

    進入 qiime2-2022.8 環境後輸入 :

    qiime taxa collapse \
      --i-table table-dada2-240.qza \
      --i-taxonomy taxonomy.qza \
      --p-level 4 \
      --o-collapsed-table col_table_4.qza
    

    --p-level : 這邊就要決定要繪製的分類階層 (taxonomic rank) :

    參數 階層

    \ 1 | 界 Kingdom |
    \ 2 | 門 Phylum |
    \ 3 | 綱 Class |
    \ 4 | 目 Order |
    \ 5 | 科 Family |
    \ 6 | 屬 Genus |
    \ 7 | 種 Species |
    --o-collapsed-table : 檔案管理方便,若是有輸出不同階層,記得更改檔名。

    完成後會顯示 :

    '
    Saved FeatureTable[Frequency] to: col_table_4.qza
    '
    
  • 熱圖 (Heat map) 製作

    qiime feature-table heatmap \
      --i-table col_table_4.qza \
      --o-visualization heatmap_4.qzv \
      --p-color-scheme YlOrRd \
      --p-cluster features
    

    --p-color-scheme : 好的熱圖顏色帶你上天堂,一般來說會希望越多的顏色越深,還有更多選擇,以下顯示私心推薦的選項,喜歡就直接記住前面的單字於指令中改動 (若此參數不填,跑出來蠻醜的)。
    https://ithelp.ithome.com.tw/upload/images/20220911/20151510DM4Xjcw1I2.png
    --p-cluster : 可使用 features、samples、both、none,
    根據序列/樣本/兩者/都不要,
    進行聚類 (clustering) 排序。
    若樣本名稱帶有分組的含意(如 CT_1, CT_2, EXP_3, EXP_4),
    可以使用 features 就好,就能快速看出實驗組是否與對照組間有菌相差異。
    除了上述參數外,還有一些進階選項 :
    例如 --p-method 依照不同階層式分群法 (hierarchical clustering)可以分成 : average、centroid、complete、median、single、ward、weighted。
    預設為 average [選填參數]

    完成後會顯示 :

    '
    Saved Visualization to: heatmap_4.qzv
    '
    

    同樣將heatmap_4.qzv拖曳到 QIIME2 VIEW :

    https://ithelp.ithome.com.tw/upload/images/20220911/20151510KV3dF3o5kV.png

    --p-level 4 / --p-cluster samples

    https://ithelp.ithome.com.tw/upload/images/20220911/201515101cFV8iS4Zm.png

    --p-level 4 / --p-cluster features

    發現差別了嗎? 兩者分別對樣本/特徵ID進行聚類。


本篇使用到的輸入/輸出檔案 :
Input : table-dada2-240.qza、taxonomy.qza、col_table_4.qza
Output: col_table_4.qza、heatmap_4.qzv

下回是多樣性統計!


上一篇
[Day 13] NGS QIIME2 : 繪製親緣關係樹 (Phylogenic tree) 與 iTOL 應用
下一篇
[Day 15] NGS QIIME2 : 統計分析前樣本的取捨 - 取樣深度 (Sampling depth)
系列文
16S rRNA 從次世代到三代定序-生資QIIME2資料分析趣33
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言