講完 Data Catalog 與 ETL Job 後,在整個資料處理的流程中可能會需要用自動化的方式讓整個流程可以夠便利,而今天就要來介紹如何創建 Glue...
今天要來補充一下昨天的小細節,昨天有介紹完 Workflow 的使用方式,可以正常產生出每個User購買最多的前五名商品,但如果是使用昨天的 S3 資料階層來當...
在介紹 Data Catalog 連接 Redshift 之前,我們先介紹 Redshift 這個資料庫 Redshift 在 AWS 上的定位是 Data W...
在介紹完 Redshift 後,我們直接來創建一個 Redshift 首先在創建 Redshift 前,需要先創建 cluster subnet group...
Data Catalog 不只可以使用 S3 作為資料的存取點,也可以使用既有的資料庫作為資料的存取點,今天要來介紹如何將 Redshift 作為 Data C...
之前在Glue 上進行資料存取時都是使用 S3,而今天我們要透過 Glue Job 將 S3 資料儲存到 Redshift 首先我們先準備資料,這次我是使用...
接下來我們要來測試是否可以每天進行 Redshift 的資料更新,並且不會產生重複的資料 修改完 ETL Job 的 Script 後就可以直接執行此 Job...
QuickSight 是 AWS 的 BI 工具,QuickSight 可以非常方便且簡單的串接 AWS 的資料庫或 S3,在 QuickSight 中可以 J...
在設定完相關的環境參數後,可以開始設定 Redshift 的連接 一樣先到 QuickSight 的主頁,點選 New analysis 在點選 New...
在資料源設定完成後,接下來介紹如何繪製圖表 資料源是代表著每個 User 購買數量前五多的商品,而這個圖表我想要看哪些商品的購買量最多? 我們使用長條圖,並將...