雖然昨天已經解釋過 Network Science 是一門研究非結構化網路圖的學科,它提供比一般結構化資料更豐富的資訊。為了更清楚解釋為什麼我想深入研究這個領域,我用一個簡單的例子來說明。
例子中,假設我們有一個實驗室,其中的成員年齡不盡相同。如果我們只看傳統的資料表格並且使用機器學習去預測哪些同學是同一屆的,傳統的機器學習模型會將年齡相近的人歸為同一屆。很合理,因為過去的經驗表明,通常上一屆的學生年紀較大,而下一屆的則較年輕。這樣的推論建立在歷史資料的基礎上,然而卻忽略了人跟人之間可能存在的更多複雜關係。
如果我們改用網路圖(社群網路圖),以同個實驗室的學生互動作為基礎(這邊的假設是同屆的學生可能會一起修課、寫作業或是一起出去玩)。如下 Fig 1 所示。這樣的關係圖能更好地呈現真實的互動情況,而不僅僅是基於年齡的推斷。
從 Fig 1 也可以看出同個實驗室在互動上分成兩群,像是 Fig 2 這樣,也很合理,畢竟碩一的時候就是修課地獄,一起修課會比較輕鬆,自然比較容易有互動。因此,像是這樣的網路圖更能補足以往結構型資料的不足。
Fig 1 : 實際互動的網路圖
Fig 2 : 不同屆用不同顏色表示