我們的 iTop 資產來源大部分都是透過 Data Collector 外掛來同步外部系統的資訊,那麼對於 Data Synchronization 資料同步流...
前兩天我們反覆地強調,在一個 OLTP 系統,高度符合正規化設計,且具備一定業務量的資料庫裡,要取得合用的分析資料,需要付出不少代價,包含業務受影響、查詢效能...
前言 我這邊的說明和舉例其實都是 dbt Core 的部分,老實說 dbt Cloud 我也沒有好好玩過,所以先打個預防針,避免差異過大,造成誤導,如果有任何疑...
DBT 的由來 dbt(data build tool)最初由數據諮詢公司 Fishtown Analytics 創建,目的是解決數據轉換和分析工程中的挑戰。...
ETL概述 ETL(Extract, Transform, Load)是一種用於從不同數據源中提取數據、對數據進行轉換處理並將其載入到目標數據存儲中的過程。這個...
激活層資料模型範例(續) 淺談360資料模型 在激活層內最常用到的資料模型通常是某種360模型。顧名思義,360資料模型基本上就是一個實體的360 度視圖,目標...
激活層資料模型範例 用一個比較簡單的與常見的使用案例來做範例,假設某一個公司的商業模型如下: 客戶獲取(Customer Acquisition)和客戶引導(...
配合rETL和C-CDP的激活層模型設計 之前提到了資料激活層(Data Activation Layer)在現代資料棧(Modern Data Stack)裡...
ELT 是什麼?和 ETL 有什麼差異? 大家安安,今天我們一起來聊聊 ELT 和 ETL 這兩個常見的資料處理方式。前幾天在 Day 15 : 多系統整合 P...
前言 昨天介紹了ETL概念,今天要實作ETL工具Apache NiFi的流程,它的應用可以滿廣的,今天先以基本的功能展示它的作用,那以下就開始介紹Apache...
前言 mentor:幫我研究一下ETLETL 的介紹ETL有哪些套件( 幫我比較至少三個ETL的套件 ) 由於之後專案需求要做到多項系統整合,因此會有各種資...
多系統整合 Part4 - 擷取、轉換、載入 (ETL) 在前幾篇文章中,我們已經討論了多系統整合的必要性、使用電子資料交換(EDI)和應用程式介面(API)的...
ETL & SQL review 這個作業那時我花最多時間的是研究作業的data(restaurant_with_menu.json, users_wi...
我發現最近幾年的比較已經變成 Data Pipeline vs. ETL Pipeline。 人外有人,天外有天 這個系列讓我有機會再次更新自己資料領域的知識庫...
ETL 大概有八成的時間,都是在跟各種儲存系統互動。不管是常見的資料庫、BigQuery,或是 Redis, Hadoop,這些本質上都是儲存系統,差別只是連接...
身為一名數據工程師,每天寫 code 做的事情簡單來說,都是 ETL。 Extract、Transform、Load(ETL)是一個常用於資料庫管理和商業智能領...
Hi, day15來到了tableau prep的最後一篇文章 前面介紹了14篇關於tableau prep的操作, 這邊或許有些人會有疑問為什麼需要做資料清理...
Hi, day14我們來講當我們將資料清理成我們的需求格式後, 該如何輸出檔案? 在tableau prep中提供了三種輸出的選項 輸出至本機端的檔案(exc...
Hi, day13快要到本次系列文tableau prep的部分尾聲了前面幾篇主要是在解說資料ETL的T(Transform)的部分, 也是最核心的 今天來講解...
Hi, day12我們來講更進階的正則表達式這次會用到以下這兩個函式REGEXP_REPLACE(多重自訂規則取代字元)REGEXP_EXTRACT(多重自訂規...
Hi, day11要來介紹tableau prep中的TRIM函式,這個函式可以去除字串前面&後面的空格, 在遇到需要處理字串長度的狀況可以使用到 TR...
Day10我們來看另一個tableau prep的主要功能之一, 樞紐資料(pivot), 何謂樞紐資料?在處理資料的過程, 以常見的表格來說,人們傾向於表格是...
Day9我們來聊聊甚麼是聯結資料(join) 聯結資料意思是兩個表格之間有至少一個或以上的欄位是有關連(相同)性的, 那麼就可以透過有關連性的欄位將資料表格橫向...
Day8來講講彙總資料aggregate是甚麼吧 在我們整理完資料後, 資料會一列一列的呈現出來, 例如範例資料可以看到我們整理出來的表格有交易日, STORE...
Day7我們一起來看在tableau prep中的主要處理方式之一聯集資料(union) 所謂的聯集意思是, 將不同的資料表格中, 把這些表格上下連接成一個表格...
Hi, day6讓我們來談談甚麼是正則表達式吧, 在資料處理的過程中, 我們難免會遇到資料非常髒亂的狀況, 但是在電腦的理解中, 有一個很特別的方式, 名稱叫做...
Hi, day5我們一起來看看, 遇到數字格式的欄位時, 在實務需求中會怎麼處理吧! 情境1:資料欄位FEE中, 有null值, 負數值, 正數值, 非null...
Hi, day4我們接著來介紹, 若遇到字串欄位時, 在實務中遇到需求可以怎麼處理, 情境1:資料欄位STORE_CITY, 當中包含了各縣市名稱, 若今天需求...
Hi, 今日要來介紹如何處理日期時間欄位, 首先將範例資料載入到tableau prep中, 我們點選 + 符號, 可以看到有很多步驟可以選擇, 我們的需求是要...
Hi, 在介紹今天的主題前,先說明何謂資料ETL, 也是此系列文的主題名稱有提到的 E(extract擷取):將原始資料從server端或本地端匯入暫存處(ta...