超級比一比之 CPM, FPKM, TPM RNA-Seq 的主要目的之一就是找到試驗設計處理組間的差異表現基因 (Differential Expressio...
昨天我提到了CNV 在昨天開啟了copy number variation系列文的篇章之後,簡單地介紹了CNV是什麼,以及CNV的生物意義,今天我將來介紹目前常...
在生物資訊領域中,我們最常幹的事情裡頭絕對少不了序列比對 (sequence alignment)這個工作,而我們用來評估比對後結果的好壞,最常使用的標準之一又...
最新版本請見:https://chenhsieh.com/post/bioinfo/09-trimmomatic/ 自動修剪機,修鹼基 fastq 檔案中存放的...
關於這系列 我預計用4+1篇的篇幅來講一下關於所謂的拷貝數變異的問題、如何分析拷貝數變異、有哪些演算法及實作,以及最後的在Julia底下該怎麼來分析這種資料。...
最新版本請見:https://chenhsieh.com/post/bioinfo/03-anaconda/ 勇者您好,請選擇初始職業與裝備 這篇繼續進行啟程前...
為什麼要先看這個? 昨天我以最近正在處理的其中一種資料作為這次鐵人賽挑戰的第一個範例,其中主要得先靠著parse某一個資料表格後,抽取出我需要的資料,再使用Bi...
最新版本請見:https://chenhsieh.com/post/bioinfo/12-bowtie2/ 燕尾服套裝軟體取名的惡趣味總讓我想到黑暗大法師 RN...
最後一天 收集資料也是生物資訊領域也很重要的一環,而且不是每個資料庫網站都很貼心地提供API讓我們很同意地取得資料,故這最後一天姑且讓我們來看看怎麼使用Juli...
需求 前幾天談到的東西幾乎都是與序列比對有關,特別是BLAST之類的比對方法及結果。今天要談的是另外一些比對工具產生的結果,以及怎麼使用Julia底下的工具來處...
萬事具備,就欠東風 某種程度上來說,雖然Julia目前所擁有的生物資訊相關套件並沒有R或是Python來的多,但無法很快地吸引很多朋友來跟著學習使用這個新語言最...
繼續昨天的話題 昨天的文章簡單地介紹了幾種偵測CNV的實驗方法及其原理,原本想繼續寫關於CNV-calling的東西,不過這幾天實在是休息不夠,狀態不是很好。這...
Nextflow是啥? Nextflow是一種基於Groovy語言寫成的workflow framework。Workflow framework對我們這些搞生...
昨天介紹了分析Array-based資料當中CNV的一種方法 所以今天就不意外地要介紹一下目前用來分析NGS資料當中CNV的方法了!根據Computationa...
綜合分析篇來囉 『園藝 boy 的生物資訊冒險記趣,跟上學術潮流不走冤望路』系列共有四部分:「基礎篇」、「轉錄體流程篇」、「綜合分析篇」、以及「學術生活篇」。「...
今天打算來分享一篇最近才發表在Cell期刊系列的子期刊 ― Molecular Cells上面的論文:Efficient and Accurate Quanti...
KEGG 簡介 Kyoto Encyclopedia of Genes and Genomes 緣起於 1995 年,由京都大學化學研究所教授金久實提出,最大的...
用 HMMER 掃描序列 演化的基本假設之一就是不同的物種或不同的基因家族成員可能具有共同的祖先,也就是同源(homology) 的概念。我們將序列相似度高的基...
基因調控 基因表現是基因體上的 DNA 序列被聚合酶作用合成 RNA 的轉錄過程,整個轉錄過程中有許多不同的蛋白質共同參與,每個蛋白質複合體形成的環節都會影響轉...
話不多說,今天忙到現在才有空寫,就直接接續昨天的話題,不過今天我就直接貼上這些步驟所需的commands了。 Pre-processing 由於我目前最常碰到的...
今天不寫技術文 這次參加這個鐵人挑戰賽,部份的原因也是因為受到Julia Taiwan社群發起人杜岳華所鼓舞。從以前知道這個語言,到後來真的看到有人將這個語言應...
最新版本請見:https://chenhsieh.com/post/bioinfo/01-cyborg-and-bioinfo/ 想寫點生物資訊的東西,為什麼要...
最新版本請見:https://chenhsieh.com/post/bioinfo/06-sra-1/ 每次追動畫最不想看到的就是混時間的總集篇 但是該省的經費...
用 seaborn 繪製特色圖表 比起 R 語言,python 的使用場合更多樣化,因此時常要自行引入相關功能的函式庫。在資料視覺化上最常聽到的 python...
社交惡夢之請跟你座位旁的同學一組 k-means clustering 是我覺得最直觀好理解的分群方式。完整分群的過程概念可以分成兩大部分: 一是計算資料點之間...
關於生物資訊分析 前幾天雜七雜八地寫了很多東西,最主要的點就在於—生物資訊的分析本身通常都是由一堆別人開發好的工具加上我們自己寫的資料處理scripts所組成(...
還記得前幾天有談到的scope issue 當時一開始只是自己在寫loop時,發現全域變數在for-loop當中無法被改變,查看了官方文件之後,才知道原來是sc...
上一篇我們的基因體時代-AI, Data和生物資訊 Day01- 超越摩爾定律的資料增長介紹了生醫領域在未來將會產生越來越多的資料,甚至可以使用像是DNA當作是...
說到Module 在看了官方說明文件的解說之後,仍然有點霧煞煞,我還是先以R語言中的namespace加上environment來理解它好了。簡單說,我認為Ju...
請證明你不是機器人 繪製親緣關係樹的前置工作中,搜集所有適合一起比對的基因之序列是十分累人的工作。我不寫程式以前,會找一首喜歡的專輯,放著聽,然後開始開啟大量瀏...