iT邦幫忙

bioinformatics相關文章
共有 47 則文章
鐵人賽 自我挑戰組 DAY 16

技術 [Day 16] 分析Copy number variation系列 (壹)

昨天我提到了CNV 在昨天開啟了copy number variation系列文的篇章之後,簡單地介紹了CNV是什麼,以及CNV的生物意義,今天我將來介紹目前常...

技術 在sequence alignment中我們所謂的sequence identity到底是啥?

在生物資訊領域中,我們最常幹的事情裡頭絕對少不了序列比對 (sequence alignment)這個工作,而我們用來評估比對後結果的好壞,最常使用的標準之一又...

鐵人賽 自我挑戰組 DAY 15

技術 [Day 15] 分析Copy number variation系列(零)

關於這系列 我預計用4+1篇的篇幅來講一下關於所謂的拷貝數變異的問題、如何分析拷貝數變異、有哪些演算法及實作,以及最後的在Julia底下該怎麼來分析這種資料。...

鐵人賽 自我挑戰組 DAY 3

技術 [Day 4] 使用Julia讀取表格資料

為什麼要先看這個? 昨天我以最近正在處理的其中一種資料作為這次鐵人賽挑戰的第一個範例,其中主要得先靠著parse某一個資料表格後,抽取出我需要的資料,再使用Bi...

鐵人賽 自我挑戰組 DAY 30

技術 [Day 30] 疑?最後一天了,來看看怎麼使用Julia爬蟲好了

最後一天 收集資料也是生物資訊領域也很重要的一環,而且不是每個資料庫網站都很貼心地提供API讓我們很同意地取得資料,故這最後一天姑且讓我們來看看怎麼使用Juli...

鐵人賽 自我挑戰組 DAY 10

技術 [Day 11] 使用Julia處理Fastq/SAM/BAM/VCF/BED/GTF檔

需求 前幾天談到的東西幾乎都是與序列比對有關,特別是BLAST之類的比對方法及結果。今天要談的是另外一些比對工具產生的結果,以及怎麼使用Julia底下的工具來處...

鐵人賽 自我挑戰組 DAY 11

技術 [Day 12] 關於Julia裡頭的繪圖

萬事具備,就欠東風 某種程度上來說,雖然Julia目前所擁有的生物資訊相關套件並沒有R或是Python來的多,但無法很快地吸引很多朋友來跟著學習使用這個新語言最...

鐵人賽 自我挑戰組 DAY 17

技術 [Day 17] 分析Copy number variation系列 (貳)

繼續昨天的話題 昨天的文章簡單地介紹了幾種偵測CNV的實驗方法及其原理,原本想繼續寫關於CNV-calling的東西,不過這幾天實在是休息不夠,狀態不是很好。這...

鐵人賽 自我挑戰組 DAY 25

技術 [Day 25] 在Nextflow底下用Julia如何?

Nextflow是啥? Nextflow是一種基於Groovy語言寫成的workflow framework。Workflow framework對我們這些搞生...

鐵人賽 自我挑戰組 DAY 18

技術 [Day 18] 分析Copy number variation系列(參)

昨天介紹了分析Array-based資料當中CNV的一種方法 所以今天就不意外地要介紹一下目前用來分析NGS資料當中CNV的方法了!根據Computationa...

鐵人賽 自我挑戰組 DAY 16

技術 RNA-Sick@Day16 > 基因代號進得去,生物意義出得來,GO 發大財|基因本體論富集分析 feat. Gene Ontology (上)

綜合分析篇來囉 『園藝 boy 的生物資訊冒險記趣,跟上學術潮流不走冤望路』系列共有四部分:「基礎篇」、「轉錄體流程篇」、「綜合分析篇」、以及「學術生活篇」。「...

鐵人賽 自我挑戰組 DAY 13

技術 [Day 13] Julia也能用來分析RNA選擇性剪切耶

今天打算來分享一篇最近才發表在Cell期刊系列的子期刊 ― Molecular Cells上面的論文:Efficient and Accurate Quanti...

鐵人賽 自我挑戰組 DAY 25

技術 RNA-Sick@Day25 > 我念 HMMER,但是我朋友都念 HMMER,聽說正解是HMMER|基於隱藏式馬可夫鍊的超強序列比對軟體 feat. HMMER3

用 HMMER 掃描序列 演化的基本假設之一就是不同的物種或不同的基因家族成員可能具有共同的祖先,也就是同源(homology) 的概念。我們將序列相似度高的基...

鐵人賽 自我挑戰組 DAY 23

技術 RNA-Sick@Day23 > 基因調控什麼的最喜歡了|啟動子區段序列之順式作用元件分析 feat. PLACE database

基因調控 基因表現是基因體上的 DNA 序列被聚合酶作用合成 RNA 的轉錄過程,整個轉錄過程中有許多不同的蛋白質共同參與,每個蛋白質複合體形成的環節都會影響轉...

鐵人賽 自我挑戰組 DAY 8

技術 [Day 9] 從Fastq出發到abundance table (二)

話不多說,今天忙到現在才有空寫,就直接接續昨天的話題,不過今天我就直接貼上這些步驟所需的commands了。 Pre-processing 由於我目前最常碰到的...

鐵人賽 自我挑戰組 DAY 12

技術 昨晚的Julia Taiwan Meetup與今早的北-BiO Meetup

今天不寫技術文 這次參加這個鐵人挑戰賽,部份的原因也是因為受到Julia Taiwan社群發起人杜岳華所鼓舞。從以前知道這個語言,到後來真的看到有人將這個語言應...

鐵人賽 自我挑戰組 DAY 24

技術 RNA-Sick@Day24 > 關於資料視覺化,我想說的是|用 python 繪製充滿特色的圖表 feat. seaborn

用 seaborn 繪製特色圖表 比起 R 語言,python 的使用場合更多樣化,因此時常要自行引入相關功能的函式庫。在資料視覺化上最常聽到的 python...

鐵人賽 自我挑戰組 DAY 20

技術 RNA-Sick@Day20 > 快用你那無敵的非監督機器學習想想辦法吧|依據表現量特徵將基因分群 feat. K-means clustering (下)

社交惡夢之請跟你座位旁的同學一組 k-means clustering 是我覺得最直觀好理解的分群方式。完整分群的過程概念可以分成兩大部分: 一是計算資料點之間...

鐵人賽 自我挑戰組 DAY 4

技術 [Day 5] 在Julia底下用pipeline串連一堆指令

關於生物資訊分析 前幾天雜七雜八地寫了很多東西,最主要的點就在於—生物資訊的分析本身通常都是由一堆別人開發好的工具加上我們自己寫的資料處理scripts所組成(...

鐵人賽 自我挑戰組 DAY 26

技術 [Day 26] 關於Julia的Performance

還記得前幾天有談到的scope issue 當時一開始只是自己在寫loop時,發現全域變數在for-loop當中無法被改變,查看了官方文件之後,才知道原來是sc...

鐵人賽 AI & Data DAY 2

技術 我們的基因體時代-AI, Data和生物資訊 Day02- 機器學習在生物資訊中之應用

上一篇我們的基因體時代-AI, Data和生物資訊 Day01- 超越摩爾定律的資料增長介紹了生醫領域在未來將會產生越來越多的資料,甚至可以使用像是DNA當作是...

鐵人賽 自我挑戰組 DAY 28

技術 [Day 28] 初識Julia裡頭的Module

說到Module 在看了官方說明文件的解說之後,仍然有點霧煞煞,我還是先以R語言中的namespace加上environment來理解它好了。簡單說,我認為Ju...

鐵人賽 自我挑戰組 DAY 22

技術 RNA-Sick@Day22 > 誰能阻止少年專題生呢?他們聽不到|用程式上 NCBI 資料庫 feat. NCBI Entrez

請證明你不是機器人 繪製親緣關係樹的前置工作中,搜集所有適合一起比對的基因之序列是十分累人的工作。我不寫程式以前,會找一首喜歡的專輯,放著聽,然後開始開啟大量瀏...