iT邦幫忙

bioinformatics相關文章
共有 43 則文章
鐵人賽 自我挑戰組 DAY 27

技術 RNA-Sick@Day27 > 嘴巴說可以,身體卻一點也不老實啊|程式碼筆記本保證研究可再現性 feat. NextJournal

每次遇到宣稱很棒很優秀實際上傲嬌不給用的軟體實在是很困擾啊 生物資訊研究中,研究者時常需要自己編寫客製化的程式碼腳本。不論是視覺化或是統計分析的功能,通常都是引...

鐵人賽 自我挑戰組 DAY 26

技術 RNA-Sick@Day26 > 不被名稱耽誤的套裝軟體|直接由序列內容預測功能區段 feat. MEME suite

綜合分析篇之總集編 來回顧一下短短的綜合分析篇學了什麼吧~ RNA-Sick@Day16 > 基因代號進得去,生物意義出得來,GO 發大財|基因本體論富集...

鐵人賽 自我挑戰組 DAY 25

技術 RNA-Sick@Day25 > 我念 HMMER,但是我朋友都念 HMMER,聽說正解是HMMER|基於隱藏式馬可夫鍊的超強序列比對軟體 feat. HMMER3

用 HMMER 掃描序列 演化的基本假設之一就是不同的物種或不同的基因家族成員可能具有共同的祖先,也就是同源(homology) 的概念。我們將序列相似度高的基...

鐵人賽 自我挑戰組 DAY 24

技術 RNA-Sick@Day24 > 關於資料視覺化,我想說的是|用 python 繪製充滿特色的圖表 feat. seaborn

用 seaborn 繪製特色圖表 比起 R 語言,python 的使用場合更多樣化,因此時常要自行引入相關功能的函式庫。在資料視覺化上最常聽到的 python...

鐵人賽 自我挑戰組 DAY 23

技術 RNA-Sick@Day23 > 基因調控什麼的最喜歡了|啟動子區段序列之順式作用元件分析 feat. PLACE database

基因調控 基因表現是基因體上的 DNA 序列被聚合酶作用合成 RNA 的轉錄過程,整個轉錄過程中有許多不同的蛋白質共同參與,每個蛋白質複合體形成的環節都會影響轉...

鐵人賽 自我挑戰組 DAY 22

技術 RNA-Sick@Day22 > 誰能阻止少年專題生呢?他們聽不到|用程式上 NCBI 資料庫 feat. NCBI Entrez

請證明你不是機器人 繪製親緣關係樹的前置工作中,搜集所有適合一起比對的基因之序列是十分累人的工作。我不寫程式以前,會找一首喜歡的專輯,放著聽,然後開始開啟大量瀏...

鐵人賽 自我挑戰組 DAY 20

技術 RNA-Sick@Day20 > 快用你那無敵的非監督機器學習想想辦法吧|依據表現量特徵將基因分群 feat. K-means clustering (下)

社交惡夢之請跟你座位旁的同學一組 k-means clustering 是我覺得最直觀好理解的分群方式。完整分群的過程概念可以分成兩大部分: 一是計算資料點之間...

鐵人賽 自我挑戰組 DAY 19

技術 RNA-Sick@Day19 > 快用你那無敵的非監督機器學習想想辦法吧|依據表現量特徵將基因分群 feat. MAPMAN (上)

需要將基因分群的場景 試驗設計有兩個組別以上的話,就會有超過一組的處理比較組。比如說香蕉由綠轉黃的過程就可以分成很多階段,取其中的四個階段採樣,同一轉錄產物在...

鐵人賽 自我挑戰組 DAY 16

技術 RNA-Sick@Day16 > 基因代號進得去,生物意義出得來,GO 發大財|基因本體論富集分析 feat. Gene Ontology (上)

綜合分析篇來囉 『園藝 boy 的生物資訊冒險記趣,跟上學術潮流不走冤望路』系列共有四部分:「基礎篇」、「轉錄體流程篇」、「綜合分析篇」、以及「學術生活篇」。「...

鐵人賽 自我挑戰組 DAY 12

技術 RNA-Sick@Day12 > 路遙知馬力,日久見人心|用燕尾服套裝將序列比對到參考對象上 feat. Bowtie2

燕尾服套裝軟體取名的惡趣味總讓我想到黑暗大法師 RNA-Seq 主要目的之一就是推估樣本中轉錄產物豐富度,這個過程可以分成 短讀序在參考序列上位置之指定 (...

鐵人賽 自我挑戰組 DAY 9

技術 RNA-Sick@Day9 > 斷開序列,斷開一切的牽連|把品質不佳的序列剔除掉 feat. Trimmomatic

自動修剪機,修鹼基 fastq 檔案中存放的資料包括序列及其對應的品質,雙端定序的結果分別存放在結尾標記 -1 和 -2 的檔案中。必須將定序品質不佳的鹼基剔除...

鐵人賽 自我挑戰組 DAY 6

技術 RNA-Sick@Day6 > 我相信自由自在,我詳細希望|下載 NCBI 上的原始序列 feat. SRA Toolkit (上)

每次追動畫最不想看到的就是混時間的總集篇 但是該省的經費還是要省,讓我們來看看已經學過了什麼吧! (截圖來自動畫 Kill La Kill) RNA-Sick...

鐵人賽 自我挑戰組 DAY 3

技術 RNA-Sick@Day3 > 小孩子才要做選擇,我全都要|入門生物資訊該學什麼語言呢 feat. Anaconda

勇者您好,請選擇初始職業與裝備 這篇繼續進行啟程前的準備,雖然我在引言中強調過不見得要寫程式,只要執行現成的程式碼或套件來完成剛好需要的分析,所使用的程式碼與套...

鐵人賽 自我挑戰組 DAY 1

技術 RNA-Sick@Day1 > 你己被選中成為「賽博格研究生」|生物資訊 の 冒險記趣 feat. Phylo

想寫點生物資訊的東西,為什麼要扯賽博格 生物資訊 (bioinformatics) 是利用應用數學、資訊學、統計學和電腦科學的方法研究生物問題的學門;賽博格...

技術 在sequence alignment中我們所謂的sequence identity到底是啥?

在生物資訊領域中,我們最常幹的事情裡頭絕對少不了序列比對 (sequence alignment)這個工作,而我們用來評估比對後結果的好壞,最常使用的標準之一又...

技術 用Julia將一個Genome按照某個window size切並計算GC content

緣起 我在BioJulia裡頭找不到類似R語言裡頭Biostrings那個package所提供的letterFrequencyInSlidingView,所以就...

鐵人賽 自我挑戰組 DAY 30

技術 [Day 30] 疑?最後一天了,來看看怎麼使用Julia爬蟲好了

最後一天 收集資料也是生物資訊領域也很重要的一環,而且不是每個資料庫網站都很貼心地提供API讓我們很同意地取得資料,故這最後一天姑且讓我們來看看怎麼使用Juli...

鐵人賽 自我挑戰組 DAY 29

技術 [Day 29] 用Julia來研究單細胞定序?

單細胞定序 以往我們在說NGS—也就是所謂的次世代定序時,所使用的樣品DNA其實都是來自某塊組織裡的細胞(假設使用的是人類的樣品),還記得以往我們學生物學時學過...

鐵人賽 自我挑戰組 DAY 28

技術 [Day 28] 初識Julia裡頭的Module

說到Module 在看了官方說明文件的解說之後,仍然有點霧煞煞,我還是先以R語言中的namespace加上environment來理解它好了。簡單說,我認為Ju...

鐵人賽 自我挑戰組 DAY 27

技術 [Day 27] 不算初次接觸的Metaprogramming

其實之前在寫R的時候就用到了後來所知道的metaprogramming 以前為了想要讓自己用R寫的一段程式碼可以自動化地生成一堆變數,然後這些變數還可以在後面繼...

鐵人賽 自我挑戰組 DAY 26

技術 [Day 26] 關於Julia的Performance

還記得前幾天有談到的scope issue 當時一開始只是自己在寫loop時,發現全域變數在for-loop當中無法被改變,查看了官方文件之後,才知道原來是sc...

鐵人賽 自我挑戰組 DAY 25

技術 [Day 25] 在Nextflow底下用Julia如何?

Nextflow是啥? Nextflow是一種基於Groovy語言寫成的workflow framework。Workflow framework對我們這些搞生...

鐵人賽 自我挑戰組 DAY 24

技術 [Day 24] 繼續關於CNV的部份

Read-depth 由於這陣子在搞的東西跟CNV有非常大的關係,所以也陸續參考了不少文獻。前面我提過了絕大多數的演算法都是基於read depth這個值衍生出...

鐵人賽 自我挑戰組 DAY 23

技術 [Day 23] 今天練習用Julia寫HMM-forward

為什麼今天練習這個呢? 在生物資訊領域裡頭其實有非常多的工具或是演算法都是用Hidden Markov Model (HMM)去實作的,但不才我因為生性懶散,所...

鐵人賽 自我挑戰組 DAY 22

技術 [Day 22] 看一下Julia裡頭的unit test

為什麼要來看一下unit test呢? 老實說,我本身並不具有資訊工程相關背景,一開始也沒聽過什麼unit test。但自從踏入了生物資訊這個領域,隨著開發的東...

鐵人賽 自我挑戰組 DAY 21

技術 [Day 21] 回頭看一下Julia裡頭的一些規範

前面兩週都在講Bio 為了後面寫程式可以避免犯錯,今天得回過頭來讀一下Julia的說明文件,尤其是那些我之前在其他語言比較沒碰過的規範。今天我得回過頭來看的一個...

鐵人賽 自我挑戰組 DAY 20

技術 [Day 20] 先來自幹一個makewindows的功能好了

經過了將近一週 我自己大概地將CNV-calling的方法快速瀏覽過一遍了,今天先花了點時間找了一下看有哪些工具我自己不需要重寫過一次,歸納如下: 讀寫及操作...

鐵人賽 自我挑戰組 DAY 19

技術 [Day 19] 分析Copy number variation系列(肆)

回顧一下前兩天 在前兩天的文當中,我分別介紹了應用在SNP array及NGS資料上的CNV-calling方法,今天就來看看如果我想使用julia底下的工具來...