在學術上,我們經常分析的資料通常是特殊領域資料,像AI藥物開發會使用FDA資料,推薦系統會使用顧客購買歷史紀錄,圖形辨識使用mnist手寫辨識、道路辨識資料集,除了這些偏向商業、醫療等特殊用途資料集,是否有更貼近我們日常生活、無目的性又潛藏巨大價值的資料集,答案是有,「開放資料」。
根據wiki網頁的定義,開放資料有如下定義
開放資料 (英語:Open data) 指的是一種經過挑選與許可的資料。這種資料不受著作權、專利權,以及其他管理機制所限制,可以開放給社會公眾,任何人都可以自由出版使用,不論是要拿來出版或是做其他的運用都不加以限制。
而開放出的資料通常具備以下特性
因為以上這些特性我們很容易將更多不同的資料互相搭配混和使用,基於「資料驅動」資料分析模式,就有可能產生出新的資料價值出來。
政府單位通常是開放資料最大的資料來源者,龐大的政府體系有著錯綜複雜的單位組織,在過去這些組織單位將歷年來所產出的資料封閉在內部資料庫中,外部人員無法取得查閱,也因此可能會造成各種弊端、黑箱作業等懷疑。
近年開放資料概念逐漸發展起來,這些資料被其他研究者二次分析或加工提供給民眾更通俗易懂的資訊,民眾更可以了解政府做了那些施政,還有哪些問題需要解決,不但可以提升政府的行政效率,且透明化的資料讓民眾對政府更有信心。
目前國內政府設有「政府資料開放平台」,包含各種生活資訊,下圖為開放資料種類
除了政府,民間相關團體也打造了g0v零時資料中心,相較於政府開放資料,g0v零時資料中心補足了政府資料的不足之處,因為政府可能會有政治力介入,導致資料的開放困難,因此g0v會以收集這些特殊資料為目標。
開放資料是資料再利用的第一步,後續需要更多資料分析人員來進行資料分析和創作,而目前政府是多以舉辦各種資料創新應用競賽來加速這些資料的使用率。
實際應用上,政府已能夠透過即時分析車流量資料,即時反饋給民眾壅塞的路段,讓民眾能夠避開車潮,打造更加智慧的交通。其他還有丹麥民眾自發的收集所有公共廁所地址,建立即時視覺化網站,提供民眾能夠上廁所的地方。
現在大多數開放資料都是未分析的資料,相比引入艱深的人工智慧技術,簡單的統計與正確的應用,所能夠帶來的價值或許是更為巨大的。
1. 為何要開放資料?
2. 什麼是開放資料?
3. 開放資料
4. 政府資料開放平台
5. 智慧政府