iT邦幫忙

bioinformatics相關文章
共有 26 則文章

技術 用Julia將一個Genome按照某個window size切並計算GC content

緣起 我在BioJulia裡頭找不到類似R語言裡頭Biostrings那個package所提供的letterFrequencyInSlidingView,所以就...

鐵人賽 自我挑戰組 DAY 30

技術 [Day 30] 疑?最後一天了,來看看怎麼使用Julia爬蟲好了

最後一天 收集資料也是生物資訊領域也很重要的一環,而且不是每個資料庫網站都很貼心地提供API讓我們很同意地取得資料,故這最後一天姑且讓我們來看看怎麼使用Juli...

鐵人賽 自我挑戰組 DAY 29

技術 [Day 29] 用Julia來研究單細胞定序?

單細胞定序 以往我們在說NGS—也就是所謂的次世代定序時,所使用的樣品DNA其實都是來自某塊組織裡的細胞(假設使用的是人類的樣品),還記得以往我們學生物學時學過...

鐵人賽 自我挑戰組 DAY 28

技術 [Day 28] 初識Julia裡頭的Module

說到Module 在看了官方說明文件的解說之後,仍然有點霧煞煞,我還是先以R語言中的namespace加上environment來理解它好了。簡單說,我認為Ju...

鐵人賽 自我挑戰組 DAY 27

技術 [Day 27] 不算初次接觸的Metaprogramming

其實之前在寫R的時候就用到了後來所知道的metaprogramming 以前為了想要讓自己用R寫的一段程式碼可以自動化地生成一堆變數,然後這些變數還可以在後面繼...

鐵人賽 自我挑戰組 DAY 26

技術 [Day 26] 關於Julia的Performance

還記得前幾天有談到的scope issue 當時一開始只是自己在寫loop時,發現全域變數在for-loop當中無法被改變,查看了官方文件之後,才知道原來是sc...

鐵人賽 自我挑戰組 DAY 25

技術 [Day 25] 在Nextflow底下用Julia如何?

Nextflow是啥? Nextflow是一種基於Groovy語言寫成的workflow framework。Workflow framework對我們這些搞生...

鐵人賽 自我挑戰組 DAY 24

技術 [Day 24] 繼續關於CNV的部份

Read-depth 由於這陣子在搞的東西跟CNV有非常大的關係,所以也陸續參考了不少文獻。前面我提過了絕大多數的演算法都是基於read depth這個值衍生出...

鐵人賽 自我挑戰組 DAY 23

技術 [Day 23] 今天練習用Julia寫HMM-forward

為什麼今天練習這個呢? 在生物資訊領域裡頭其實有非常多的工具或是演算法都是用Hidden Markov Model (HMM)去實作的,但不才我因為生性懶散,所...

鐵人賽 自我挑戰組 DAY 22

技術 [Day 22] 看一下Julia裡頭的unit test

為什麼要來看一下unit test呢? 老實說,我本身並不具有資訊工程相關背景,一開始也沒聽過什麼unit test。但自從踏入了生物資訊這個領域,隨著開發的東...

鐵人賽 自我挑戰組 DAY 21

技術 [Day 21] 回頭看一下Julia裡頭的一些規範

前面兩週都在講Bio 為了後面寫程式可以避免犯錯,今天得回過頭來讀一下Julia的說明文件,尤其是那些我之前在其他語言比較沒碰過的規範。今天我得回過頭來看的一個...

鐵人賽 自我挑戰組 DAY 20

技術 [Day 20] 先來自幹一個makewindows的功能好了

經過了將近一週 我自己大概地將CNV-calling的方法快速瀏覽過一遍了,今天先花了點時間找了一下看有哪些工具我自己不需要重寫過一次,歸納如下: 讀寫及操作...

鐵人賽 自我挑戰組 DAY 19

技術 [Day 19] 分析Copy number variation系列(肆)

回顧一下前兩天 在前兩天的文當中,我分別介紹了應用在SNP array及NGS資料上的CNV-calling方法,今天就來看看如果我想使用julia底下的工具來...

鐵人賽 自我挑戰組 DAY 18

技術 [Day 18] 分析Copy number variation系列(參)

昨天介紹了分析Array-based資料當中CNV的一種方法 所以今天就不意外地要介紹一下目前用來分析NGS資料當中CNV的方法了!根據Computationa...

鐵人賽 自我挑戰組 DAY 17

技術 [Day 17] 分析Copy number variation系列 (貳)

繼續昨天的話題 昨天的文章簡單地介紹了幾種偵測CNV的實驗方法及其原理,原本想繼續寫關於CNV-calling的東西,不過這幾天實在是休息不夠,狀態不是很好。這...

鐵人賽 自我挑戰組 DAY 16

技術 [Day 16] 分析Copy number variation系列 (壹)

昨天我提到了CNV 在昨天開啟了copy number variation系列文的篇章之後,簡單地介紹了CNV是什麼,以及CNV的生物意義,今天我將來介紹目前常...

鐵人賽 自我挑戰組 DAY 15

技術 [Day 15] 分析Copy number variation系列(零)

關於這系列 我預計用4+1篇的篇幅來講一下關於所謂的拷貝數變異的問題、如何分析拷貝數變異、有哪些演算法及實作,以及最後的在Julia底下該怎麼來分析這種資料。...

鐵人賽 自我挑戰組 DAY 14

技術 [Day 14] 今天繼續講Whippet這個工具

關於昨天寫的Julia也可以用來分析RNA選擇性剪切一文 後來發現這系列不只有讀者,竟然還有response之後,今天就繼續來談一下Whippet.jl這個工具...

鐵人賽 自我挑戰組 DAY 13

技術 [Day 13] Julia也能用來分析RNA選擇性剪切耶

今天打算來分享一篇最近才發表在Cell期刊系列的子期刊 ― Molecular Cells上面的論文:Efficient and Accurate Quanti...

鐵人賽 自我挑戰組 DAY 12

技術 昨晚的Julia Taiwan Meetup與今早的北-BiO Meetup

今天不寫技術文 這次參加這個鐵人挑戰賽,部份的原因也是因為受到Julia Taiwan社群發起人杜岳華所鼓舞。從以前知道這個語言,到後來真的看到有人將這個語言應...

鐵人賽 自我挑戰組 DAY 11

技術 [Day 12] 關於Julia裡頭的繪圖

萬事具備,就欠東風 某種程度上來說,雖然Julia目前所擁有的生物資訊相關套件並沒有R或是Python來的多,但無法很快地吸引很多朋友來跟著學習使用這個新語言最...

鐵人賽 自我挑戰組 DAY 10

技術 [Day 11] 使用Julia處理Fastq/SAM/BAM/VCF/BED/GTF檔

需求 前幾天談到的東西幾乎都是與序列比對有關,特別是BLAST之類的比對方法及結果。今天要談的是另外一些比對工具產生的結果,以及怎麼使用Julia底下的工具來處...

鐵人賽 自我挑戰組 DAY 9

技術 [Day 10] 使用Julia在目標物種當中搜尋一段DNA序列

為什麼我們需要在某個物種當中搜尋一段DNA序列呢? 前幾天我拿了些例子說明了怎麼使用一些簡單的步驟,來檢視我們拿到的這個樣品裡頭有哪些細菌種類,這算是這個問題的...

鐵人賽 自我挑戰組 DAY 8

技術 [Day 9] 從Fastq出發到abundance table (二)

話不多說,今天忙到現在才有空寫,就直接接續昨天的話題,不過今天我就直接貼上這些步驟所需的commands了。 Pre-processing 由於我目前最常碰到的...

鐵人賽 自我挑戰組 DAY 4

技術 [Day 5] 在Julia底下用pipeline串連一堆指令

關於生物資訊分析 前幾天雜七雜八地寫了很多東西,最主要的點就在於—生物資訊的分析本身通常都是由一堆別人開發好的工具加上我們自己寫的資料處理scripts所組成(...

鐵人賽 自我挑戰組 DAY 3

技術 [Day 4] 使用Julia讀取表格資料

為什麼要先看這個? 昨天我以最近正在處理的其中一種資料作為這次鐵人賽挑戰的第一個範例,其中主要得先靠著parse某一個資料表格後,抽取出我需要的資料,再使用Bi...