iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 24
0
Software Development

在AI的時代追求人性系列 第 24

機器學習中的人之議題(6):可視化分析

  • 分享至 

  • xImage
  •  

上篇簡單地介紹了可視化的各個領域,
並且談了一些資料/資訊可視化的細節。
這篇我就要再更近一步談可視化的另一個子領域:
「可視化分析(Visual Analytics)」

可視化分析算是可視化裡面比較晚出現的領域,
他的名字有時候也不是很好理解。
但他的核心概念就是透過把資訊可視化,
去分析一個目標的問題,
或是去探索、搜查隱藏在資料裡的重要資訊。

可視化分析最早的一個著名的例子,
是在十九世紀英國黑死病盛行的時候,
有一位約翰・史諾醫生(Dr. John Snow),
他透過把案例發生的地點畫在地圖上,
發現案例都在一條道路的抽水機附近。
去推出黑死病其實是透過水源在傳染的。
(當初大家對黑死病的理解甚少,
很多人還說是空氣或是病菌的直接傳染)
這張就是他當初畫的地圖:
https://ithelp.ithome.com.tw/upload/images/20201008/20130709yTHsdSuLbs.jpg
(因為檔案較小,建議點選圖片來源看大圖:
https://commons.wikimedia.org/wiki/File:A_map_taken_from_a_report_by_Dr._John_Snow_Wellcome_L0072917.jpg

像這樣把資訊可視化,藉此去做判斷跟分析,
是可視化分析一大重點。
(相對於資訊可視化本身,
有些時候可視化的目的只是幫助溝通,
不一定有後續分析的部分。)

可視化分析也很常用在探索性分析(Exploratory Analysis),
探索性分析的重點是,
我們可能擁有一個資料集,
但我們並不一定知道這個資料集裡面有什麼資訊。
即使我們可能有一些想關心的問題,
但細節的問題要問什麼,並不一定一開始就知道。

以約翰史諾的例子來說,
當初他可能擁有這些病人的資料,
嘗試著要尋找這些病人之間究竟有什麼關聯性,
但從這些病人中是不是真的能推得黑死病的傳染途徑,
他也不是一開始就知道。

但在探索性分析中,
我們會透過探索資料,逐漸形成一些假說,
然後再透過分析資料,
去驗證這些假說是不是真的。

而可視化分析在這裡,
很大的用途就是透過可視化,
讓分析的人可以很快去判斷一件事情的是非。

比如說約翰史諾一開始假設了職業對得黑死病的影響,
他可以去畫出一個圖表,
看看職業跟黑死病的確診數有沒有相關。
如果圖上面看不出明顯的關聯性,
那他也不需要再更細節去做統計檢定。

而他可能也是在嘗試各種方式畫出圖表的時候,
把病例畫在地圖上,發現他們都圍繞著一條街,
才推出他的理論的。

可視化分析在很多需要做決策的領域都有應用。
比如說天文觀測的望遠鏡,
在接收到資訊後,要怎麼樣判斷望遠鏡往哪個方向移動,
比較有可能找到目標的資訊(像特定的星種)

或者是在金融分析上,
也會有很多人透過視覺化圖表,
去分析是否應該進行一些操作。

在研究推特之類的計算社會學上,
也會有很多人嘗試著把推特跟推主等等的關係可視化,
希望推出推主之間如何互動、
錯誤訊息如何被傳開等等的問題。

在機器學習上,可視化分析也有很多用途。
比如說我們可以利用可視化分析,
去檢驗是否資料夠具代表性。
Google出的一個名為Facet的工具
就是在做這件事情。

除此之外我們也可以去看一個特徵值對於分類錯誤的影響,
微軟研究院之前有一篇研究推出的一個名為FeatureInsight的工具,
就是在做這方面的事情。

我們甚至可以用可視化分析,
去探索模型的錯誤與資料點、特徵值之間的關係。
這個牽扯到「互動性機器學習(Interactive Machine Learning)」,
這邊我下一篇可以細談,但也推薦一個我在微軟研究院實習時做的作品給大家參考:
Yes
(這是後來他們拿去改過和進一步延伸的成果)

總之我的博班研究很多就是在做,
如何設計可視化分析工具,來幫助做AI的人,
分析各種訓練機器學習模型會需要分析的資訊
(像是訓練出來的結果、不同的設定對結果的影響、
資料集的探索。)
如果有興趣的人歡迎再找我私下交流啦!


上一篇
機器學習中的人之議題(5):資料可視化的好與壞
下一篇
機器學習中的人之議題(7):以人為中心的機器學習與互動式機器學習簡介
系列文
在AI的時代追求人性30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言