iT邦幫忙

DAY 1
0

展現資料之美系列 第 1

Google流感趨勢與大數據

Big Data (大數據) 是當下資訊科技最常被討論的項目之一,他有很多面向,有人從資料儲存的角度去看,討論如何更有效率的去儲存那些巨量的資料,以因應經濟或綠能的需求。有人提出資訊架構的方式,演繹如何有效地去分析資料。有人從研發新的演算法,希冀從看是雜亂無章的資料中,發掘出具有意義,或是能提供產值的資訊。我們或許可以說,在IT領域中,個個類型的業者,不管是軟、硬體或是通路、服務商,都會試圖在大數據的浪潮中找到屬於自己的立足點。

不管看待大數據的面向是甚麼,相信大家都同意其最終目的就是要能提供有用的資訊,甚至更期望能看到傳統模式下所看不到的資訊,已贏得決策或商業競爭的先機。也就是說在大數據中,資訊才是重點。

當大數據概念剛被提出來的時候,最經典也是最常被引用的例子應該就是 Google 利用搜尋引擎所收集的相關的關鍵字搜尋動作資料,歸納出全美的流感趨勢 (於2008年11月發表在Nature期刊上: Detecting influenza epidemics using search engine query data )。其預測結果在當時不僅領先美國疾病管制局CDC的公告,而且也十分契合。

Google 從大量的搜尋動作中,找出與流感發展的關連性,其背後運用了很多分析的演算法,去蕪存菁以獲得有用的資訊,這正是大數據的精神所在。

下圖顯示出Google(黑色)所預測的流感趨勢與CDC所公告的(紅色)非常的契合。圖片引用來源為Google刊載於Nature上的論文。


下一篇
問對問題
系列文
展現資料之美4

尚未有邦友留言

立即登入留言