每次遇到宣稱很棒很優秀實際上傲嬌不給用的軟體實在是很困擾啊 生物資訊研究中,研究者時常需要自己編寫客製化的程式碼腳本。不論是視覺化或是統計分析的功能,通常都是引...
綜合分析篇之總集編 來回顧一下短短的綜合分析篇學了什麼吧~ RNA-Sick@Day16 > 基因代號進得去,生物意義出得來,GO 發大財|基因本體論富集...
用 HMMER 掃描序列 演化的基本假設之一就是不同的物種或不同的基因家族成員可能具有共同的祖先,也就是同源(homology) 的概念。我們將序列相似度高的基...
用 seaborn 繪製特色圖表 比起 R 語言,python 的使用場合更多樣化,因此時常要自行引入相關功能的函式庫。在資料視覺化上最常聽到的 python...
基因調控 基因表現是基因體上的 DNA 序列被聚合酶作用合成 RNA 的轉錄過程,整個轉錄過程中有許多不同的蛋白質共同參與,每個蛋白質複合體形成的環節都會影響轉...
請證明你不是機器人 繪製親緣關係樹的前置工作中,搜集所有適合一起比對的基因之序列是十分累人的工作。我不寫程式以前,會找一首喜歡的專輯,放著聽,然後開始開啟大量瀏...
KEGG 簡介 Kyoto Encyclopedia of Genes and Genomes 緣起於 1995 年,由京都大學化學研究所教授金久實提出,最大的...
社交惡夢之請跟你座位旁的同學一組 k-means clustering 是我覺得最直觀好理解的分群方式。完整分群的過程概念可以分成兩大部分: 一是計算資料點之間...
需要將基因分群的場景 試驗設計有兩個組別以上的話,就會有超過一組的處理比較組。比如說香蕉由綠轉黃的過程就可以分成很多階段,取其中的四個階段採樣,同一轉錄產物在...
綜合分析篇來囉 『園藝 boy 的生物資訊冒險記趣,跟上學術潮流不走冤望路』系列共有四部分:「基礎篇」、「轉錄體流程篇」、「綜合分析篇」、以及「學術生活篇」。「...
超級比一比之 CPM, FPKM, TPM RNA-Seq 的主要目的之一就是找到試驗設計處理組間的差異表現基因 (Differential Expressio...
燕尾服套裝軟體取名的惡趣味總讓我想到黑暗大法師 RNA-Seq 主要目的之一就是推估樣本中轉錄產物豐富度,這個過程可以分成 短讀序在參考序列上位置之指定 (...
自動修剪機,修鹼基 fastq 檔案中存放的資料包括序列及其對應的品質,雙端定序的結果分別存放在結尾標記 -1 和 -2 的檔案中。必須將定序品質不佳的鹼基剔除...
每次追動畫最不想看到的就是混時間的總集篇 但是該省的經費還是要省,讓我們來看看已經學過了什麼吧! (截圖來自動畫 Kill La Kill) RNA-Sick...
勇者您好,請選擇初始職業與裝備 這篇繼續進行啟程前的準備,雖然我在引言中強調過不見得要寫程式,只要執行現成的程式碼或套件來完成剛好需要的分析,所使用的程式碼與套...
想寫點生物資訊的東西,為什麼要扯賽博格 生物資訊 (bioinformatics) 是利用應用數學、資訊學、統計學和電腦科學的方法研究生物問題的學門;賽博格...
在生物資訊領域中,我們最常幹的事情裡頭絕對少不了序列比對 (sequence alignment)這個工作,而我們用來評估比對後結果的好壞,最常使用的標準之一又...
緣起 我在BioJulia裡頭找不到類似R語言裡頭Biostrings那個package所提供的letterFrequencyInSlidingView,所以就...
最後一天 收集資料也是生物資訊領域也很重要的一環,而且不是每個資料庫網站都很貼心地提供API讓我們很同意地取得資料,故這最後一天姑且讓我們來看看怎麼使用Juli...
單細胞定序 以往我們在說NGS—也就是所謂的次世代定序時,所使用的樣品DNA其實都是來自某塊組織裡的細胞(假設使用的是人類的樣品),還記得以往我們學生物學時學過...
說到Module 在看了官方說明文件的解說之後,仍然有點霧煞煞,我還是先以R語言中的namespace加上environment來理解它好了。簡單說,我認為Ju...
其實之前在寫R的時候就用到了後來所知道的metaprogramming 以前為了想要讓自己用R寫的一段程式碼可以自動化地生成一堆變數,然後這些變數還可以在後面繼...
還記得前幾天有談到的scope issue 當時一開始只是自己在寫loop時,發現全域變數在for-loop當中無法被改變,查看了官方文件之後,才知道原來是sc...
Nextflow是啥? Nextflow是一種基於Groovy語言寫成的workflow framework。Workflow framework對我們這些搞生...
Read-depth 由於這陣子在搞的東西跟CNV有非常大的關係,所以也陸續參考了不少文獻。前面我提過了絕大多數的演算法都是基於read depth這個值衍生出...
為什麼今天練習這個呢? 在生物資訊領域裡頭其實有非常多的工具或是演算法都是用Hidden Markov Model (HMM)去實作的,但不才我因為生性懶散,所...
為什麼要來看一下unit test呢? 老實說,我本身並不具有資訊工程相關背景,一開始也沒聽過什麼unit test。但自從踏入了生物資訊這個領域,隨著開發的東...
前面兩週都在講Bio 為了後面寫程式可以避免犯錯,今天得回過頭來讀一下Julia的說明文件,尤其是那些我之前在其他語言比較沒碰過的規範。今天我得回過頭來看的一個...
經過了將近一週 我自己大概地將CNV-calling的方法快速瀏覽過一遍了,今天先花了點時間找了一下看有哪些工具我自己不需要重寫過一次,歸納如下: 讀寫及操作...
回顧一下前兩天 在前兩天的文當中,我分別介紹了應用在SNP array及NGS資料上的CNV-calling方法,今天就來看看如果我想使用julia底下的工具來...