我們的基因體時代-AI, Data和生物資訊 Day29-大數據追蹤COVID病毒之演進

13th鐵人賽

weitinglin66

2021-09-29 23:37:44

1873 瀏覽

分享至

上一篇我們的基因體時代-AI, Data和生物資訊 Day28-COVID大數據:資料哪裡來
開始進入另一個主題，關於COVID時期，其衍生的資料量其實是相關可觀的，分享目前有哪些關於疫情的公開資料是可以由API、官方網站或是相關應用而來的。

典範轉移：從此新興病毒不在迷漾

這次COVID疫情，造成全世界的動盪不安，但其實對於生醫領域的人則是看到完全不一樣的一面，就是人類生醫技術的進步，怎麼說呢？以前對於新興傳染病的認知和診斷，從來沒有像現在那麼的快速，甚至過去歷史沒有在這麼短的時間內就開發了藥物以及檢驗試劑，這其實就歸功於基因定序技術的進步以及檢測大數據輔助開發的關係。過去，對於新興病毒傳染病的診斷，都是依據病人的症狀以及相關的旅遊史來做推測，甚至如過去的SARS，可能都快過一年以上，才把相關的基因定序完成，可以看看下面這個時間軸，在2019年12月31號開始有相關新聞發布。

而在2020年1月11日左右我們就有這隻新興病毒的定序資料，而且這樣跨國合作的資訊就在Twitter平台上公開，相關資料也能很輕易地取得，這個算是前所未見的事情。

病毒，其實就是一段基因代碼

也許這樣過度簡化病毒了，但本質上其實可以這樣理解，細菌之於質體，有如人類之於病毒的關係，而這段基因其實決定了整個病毒的一切個性，

從上面這個figure，其來自於Nature Reivews Microbiology在2021年三月發表的文章：Coronavirus biology and replication:implications for SARS-CoV-2，可以看到整個病毒的序列基本決定了這個病毒的行為和組成。而且這個序列過了一年，我們還持續理解更多事情。

上面這張圖的上面示意圖是我們2020年初對於COVID病毒基因區塊的理解，下面則是過了一年各式各樣的定序資料取得後我們對其更深入的理解。

可以藉由序列的差異來追蹤全世界病毒的演變

這個來自Nextstrain網站的截圖，這邊視覺化清清楚楚每個COVID病毒定序資料就是一個點，每組資料的相近程度，和演進前後可以由距離和相對關係所組成的，這樣的分析其實相當複雜，方法也很多，其中蠻常見的是使用[Bayesian inference in phylogeny](Bayesian inference in phylogeny)的方法

我們的基因體時代-AI, Data和生物資訊系列第 29 篇

我們的基因體時代-AI, Data和生物資訊 Day29-大數據追蹤COVID病毒之演進

典範轉移：從此新興病毒不在迷漾

病毒，其實就是一段基因代碼

可以藉由序列的差異來追蹤全世界病毒的演變

相關閱讀

尚未有邦友留言

我們的基因體時代-AI, Data和生物資訊系列 第 29 篇

我們的基因體時代-AI, Data和生物資訊 Day29-大數據追蹤COVID病毒之演進

典範轉移：從此新興病毒不在迷漾

病毒，其實就是一段基因代碼

可以藉由序列的差異來追蹤全世界病毒的演變

相關閱讀

尚未有邦友留言

標記使用者

我們的基因體時代-AI, Data和生物資訊系列第 29 篇