iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 3
1
AI & Data

門外漢通識:資料科學無痛入門磚系列 第 3

Power Pivot 實務應用 #筆記一

  • 分享至 

  • xImage
  •  

Excel 從 2010 版導入了大數據工具 Power Pivot,讓 Excel 從單純的試算表進擊成接軌大數據的分析工具。何謂大數據(Big Data)呢?大數據具有以下 4V 特性:

  1. 大量 Volumn:數據要夠多,分析結果才具有參考價值,譬如 Google 每一天在全球透過搜尋引擎、找關鍵字的人次高達 30 億
  2. 即時 Velocity:即時反應、數據不斷翻新,新的資料要反應在舊的報表當中
  3. 多變 Variety:資料來源、種類、層面多元
  4. 真實 Veracity:數據不能造假,否則分析結果會造成誤導

大數據希望能從資料中找到商機、做精準行銷,因此我們在同時間瀏覽同一個網站,看到的廣告可能是不同的,因為平台演算法掌握著我們的習性與喜好,讓我們看到的廣告是我們喜歡的內容,這就是大數據的威力。
而 BI(Business Intelligence 商業智慧)在維基百科上的概念定義:

商業智慧,又稱商務智慧,指用現代資料倉儲技術、線上分析處理技術、資料探勘和數據展現技術,經過擷取(Extraction)、轉換(Transformation)和載入(Load),即 ETL 過程,進行數據分析以實現商業價值。將資訊變為輔助決策的知識,再將知識呈現給管理者,為管理者的決策過程提供支援。

https://ithelp.ithome.com.tw/upload/images/20200918/20129989NuprLSk7qy.jpg
圖片來源:https://powerbi.microsoft.com/zh-tw/

Power BI 有個吸引人的地方在於:強調自己動手、不需要有 IT 背景、不用會寫程式,內建功能就足以輕鬆完成大數據分析、報表製作及圖像呈現,其中的 Power Query 能串接各種平台上的資料源,如文字檔、Twitter、Facebook、其他常見資料庫系統,透過 Excel 匯入相關資料,再經由以下四大工具進行處理:

  1. Power Pivot - 匯入資料、建立資料模型、KPI 與量值計算,從海量的資料中建置結構或非結構化的資料模型、建立不同資料表之間的關聯,把輸出結果丟到 Power View 或 Power Map
  2. Power View - 負責做報表,建立圖像式、互動式、多圖層報表(如產品銷售總表)視覺展現
  3. Power Query - 進行資料的匯入與正規化處理,如果資料型態或結構不對、需要標準化,比如日期資料用數字來呈現,以致於後續不能做月報、季報、年報,此時就能做資料型態或結構的正規化處理
  4. Power Map - 如果資料中有地址資訊(如縣市名稱、座標軸、經緯度... 等)洞悉資料後,經由地理資訊建構銷售 3D 地圖、或時間定位,譬如展現全球營業據點銷售狀況

這四大工具要能順暢使用,還需配合 Excel 的正確版本:

  1. Excel 2010 - 只能跑 Power Pivot
  2. Excel 2013 - 較為完整,Power Pivot、Power View 是內建,而 Power Query、Power Map 則需下載安裝才能啟動
  3. Excel 2016 - 四大工具都是內建的

Power BI 能串接哪些資料來源,來作為分析對象呢?

  • 關聯式資料庫 - 市場上耳熟能詳的大資料庫,如 Microsoft SQL Server、Oracle、Sybase… 等
  • 一般檔案格式及其他來源資料 - Excel 工作表、CSV 文字檔、整個資料夾的匯入... 等

接下來,我們來聊聊第一個出現在 Power BI 的 Power Pivot 實務應用吧~
https://ithelp.ithome.com.tw/upload/images/20200918/20129989RdiGKmzvOD.png
圖片來源:https://www.projectclub.com.tw/hard-power/power-bi/1548-power-bi-power-pivot-power-view.html

今天先介紹 Power Pivot 的用途:

  1. 載入大型資料表(突破以往 Excel 工作表容量 1048756 列的限制),能匯入海量的資料。過去執行速度慢、效率低落,修改一個函數要重算半天;現在可以突破 1 億筆資料、採用最新演算法,速度很快、效率提升許多,從此就可以接軌大數據啦~
  2. 建立資料模型 Data Model 多個資料表之間的關聯性得以被建立,讓我們可以從中擷取需要的欄位內容,放進最終的關聯式報表
  3. 建立欄位階層
  4. 建立多個資料表之間的關聯,傳統 Excel 無法做跨資料表的鏈接、也無法同時處理多個關聯資料庫來進行分析,因此以前多要透過寫程式的方式去跑資料庫各式的報表,但一般的企業各部門使用者不一定具備程式背景,門檻太高
  5. 透過 DAX 函數進行量值計算,這是 Power BI 新的函數,數量超過 200 個、有一半和 Excel 相同,另一半是新的語法及函數結構,可透過不同角度去分析、計算手上的海量資料
  6. 設定關鍵效能指標 KPI、做燈號警示,並放進樞紐分析表當中
  7. 設定資料表行為,讓圖片、內容呈現在報表內,產生互動式效果,並用在 Power View 中

上一篇
資料科學導論 #筆記
下一篇
Power Pivot 實務應用 #筆記二
系列文
門外漢通識:資料科學無痛入門磚30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言