iT邦幫忙

2017 iT 邦幫忙鐵人賽
DAY 18
2
Big Data

我的資料科學之路系列 第 18

[Day 18] 基因表現網路

那我碩班在研究的事情是什麼呢?

基因調控

如同第1篇文章講的,我們的基因其實是動態的,雖然他在精卵結合的瞬間就決定了基因的組成,但是基因是可以被開關的!
是的!如同開關電燈泡一樣的被開關!可惜的是我們還不知道很多基因之間"開關"的機制是什麼?
在這邊,我們把這樣的機制叫作調控,也就是說,如果A會調控B的話,就代表A可以決定要把B打開或是關閉!
他就如同一張巨大的電路一樣,電路也會互相調控,基因也是如此!

人類估計大約有3萬個基因,其中只有少部份的基因會往下製造出有功能的蛋白質,這些蛋白質會讓細胞有正常的功能、能組成器官跟組織、可以分泌出去成為荷爾蒙等等,我們以往都認為只有這些基因才是有作用的。

那剩下的基因做什麼?遊手好閒?
當然不是阿!愈來愈多人在研究剩下的基因,以往人們認為是垃圾的基因其實他們會製造出RNA,他是一種不同於DNA的分子,科學家推測RNA應該比DNA出現的年代更早,而後來發現這些RNA也會參與調控的機制!
也就是說,以往認為有功能的分子是蛋白質,可以參與基因調控的分子也是蛋白質,但是現在連RNA也進來參一腳了!

我們把基因轉錄成RNA的過程稱為基因表現,這就像剛剛講的基因被打開,那就會開始表現,表現的方式就是製造出RNA,如果我們可以測量某個基因的RNA量的話,我們就可以知道基因的表現量了!
我們目前有新一代的次世代定序技術,我們可以抓出細胞內所有的RNA跟他們的量!

表現網路

抓出基因表現量了,然後可以幹嘛?可以看看不同情況的差別阿!
像是比較癌症病患跟正常病患的差別、比較不同細胞或是器官之間的差別,或是比較某種疾病有給藥跟沒給藥的差別阿!
像這樣我們可以蒐集到一些正常人跟一些癌症病患的基因表現差別來做比較,然而網路生物學做了不太一樣的比較方式!
以往的比較方式都是用統計的方式去比較有沒有統計差異,我們用網路的方式比較!

怎麼比

我們區分正常人的基因表現跟病患的基因表現,分別把基因對基因的表現量拿出來比對的話

X軸代表的是不同的樣本來源,可能是正常人或是病患的,你會看到這兩個基因的表現量蠻相像的!這時候我們就會去計算他們的相關係數,就會發現他們的相關係數很高!
這時候我們就稱他們叫作gene coexpression,也就是會有一群基因他們的行為很相似,他們會在同樣的情況同樣的時間點做很類似的事情,他們或許會有調控關係,所以我們可以把基因當成一個點,計算出來的相關係數當成連結,將有強烈相關的點連起來!

我們就得到了

我們就可以看到不同群的基因分別對應不同的生物功能,我們也可以進一步從樣本裏面告訴我們到底哪些是跟疾病相關的基因!

還記得前面我們講過的scale-free network嗎?
我們的基因表現網路就是scale-free network喔!


上一篇
[Day 17] 網路中的現象
下一篇
[Day 19] 網路的崩解
系列文
我的資料科學之路34
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言