從零基礎到實戰：利用網頁爬蟲結合 RPKM 算法計算 COVID-19 感染者肺部基因表達量 :: 2024 iThome 鐵人賽

KE-LIN (klchen)

iT邦見習生 ‧ 點數 120

台灣聚合化學品股份有限公司

3536

累計瀏覽數

站內簡訊追蹤

鐵人檔案

2024 iThome 鐵人賽

回列表

自我挑戰組

從零基礎到實戰：利用網頁爬蟲結合 RPKM 算法計算 COVID-19 感染者肺部基因表達量系列

在生物資訊學中，基因表現量分析是理解基因功能和細胞行為的關鍵步驟。隨著基因數據的快速增長，如何高效處理和分析海量基因數據，已經成為現代生物學研究中的一大挑戰。此次挑戰將聚焦於運用 Python 實現基因代號轉換，並基於 RPKM（每千鹼基轉錄本每百萬比對讀取數，Reads Per Kilobase of transcript, per Million mapped reads）計算基因表現量，以提升基因數據分析的效率。

參賽天數 24 天｜共 25 篇文章｜ 0 人訂閱訂閱系列文 RSS系列文

0 Like 0 留言 1083 瀏覽

DAY 21

Day21：理解 RPKM 計算與數據準備

在基因表現量的分析中，RPKM（Reads Per Kilobase of transcript, per Million mapped reads）是用來標準...

2024-10-05 ‧ 由 KE-LIN 分享

0 Like 0 留言 334 瀏覽

DAY 22

Day22：實際計算樣本的總讀數

今天的工作重點是確認並計算樣本的總讀數，這是 RPKM 算法中非常重要的一部分，總讀數是每個樣本中所有基因的讀數總和，它用來標準化基因的表現量，從而使不同樣本之...

2024-10-06 ‧ 由 KE-LIN 分享

0 Like 0 留言 360 瀏覽

DAY 23

Day23：準確計算基因的 RPKM 值

今天我要把之前計算出的 RPKM 值保存到 Excel 文件中，並進行驗證，以確保數據的正確性和完整性。首先我將 RPKM 的計算結果與原始的基因數據（例如基...

2024-10-07 ‧ 由 KE-LIN 分享

0 Like 0 留言 429 瀏覽

DAY 24

Day24：儲存最終數據並進行清理

今天我將集中於清理之前計算出的 RPKM 結果，並保存最終的基因表現數據，因為在進行生物學數據分析時，清理異常值是必不可少的步驟，這能夠幫助我確保結果的準確性。...

2024-10-08 ‧ 由 KE-LIN 分享

0 Like 0 留言 250 瀏覽

DAY 24

Day26：驗證最終數據的範圍與分布

今天我將對 RPKM 結果進行進一步的驗證，確保數據分布合理且沒有明顯的異常，這一步對於後續的生物學分析至關重要，因為數據的合理性會直接影響分析結果。上一天我...

2024-10-10 ‧ 由 KE-LIN 分享

KE-LIN的鐵人檔案

KE-LIN的收藏

KE-LIN的追蹤

KE-LIN的Like

KE-LIN的紀錄

KE-LIN的訂閱列表