上一篇我們的基因體時代-AI, Data和生物資訊 Day08-合成生物學與機器學習分享合成生物學領域跟機器學習的應用,如何使用機器學習的方法來減少實驗的次數,增加特定生物反應的效率,這個對於一些新興分子檢驗非常重要,如何在複雜的參數間,用更少的實驗來達到原先的目標,可以減少支出,又可以提高效率,當然這些是要搭配上實驗室的自動化才有辦法達到的。
今天持續昨天的來分享另一個也是用機器學習的方法來減少實驗所需要的參數,最佳化想要的特定特徵。
機器學習的方式其實很適合用來解決複雜系統的預測問題,生物就是一個很好的對象,因為即使是目前研究最透徹的大腸桿菌(一種單細胞原核生物),其中依舊有令人未解之處。
合成生物學中另一個很重要的概念就是引入工程領域的想法,其中Design-Build-Test是其中最重要的一個思維,也反映了如何進行好的實驗設計,但目前最大的問題就如同上一篇所顯示的,生物系統往往出乎意料,如何從每次測試中的結果來建立下次的設計,將能把合成生物學更系統化的提升。
ART是由Hector Garcia Martin團隊所開發的,他們主要是使用scikit-learn library來建立貝式集合學習(Bayesian Ensembl Learning),為何不選擇深度學習,是因為考慮到當實驗的資料量普遍小於100次,不過未來當自動化實驗越來越普遍,那這樣可能可以再調整其中的學習框架。
下面是ART的示意圖,可以看出他的Esembl model的做法
實際上的實踐方法是使用python的工具
..........
這個月的規劃貼在這篇文章中我們的基因體時代-AI, Data和生物資訊 Overview,也會持續調整!我們的基因體時代是我經營的部落格,如有對於生物資訊、檢驗醫學、資料視覺化、R語言有興趣的話,可以來交流交流!