Day 23 - 從 ClickHouse Exporter 看資料處理流程：OTLP 到 ClickHouse 的轉換 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2025 iThome 鐵人賽

DAY 23

DevOps

被稱作Server Restart Engineer的我，也想了解如何實踐可觀測性工程系列第 23 篇

Day 23 - 從 ClickHouse Exporter 看資料處理流程：OTLP 到 ClickHouse 的轉換

17th鐵人賽

Sophie

團隊動鼠做

2025-10-07 20:51:51

121 瀏覽

分享至

昨天我們透過 ClickHouse Exporter 了解了 Factory Pattern 如何統一管理不同 signal 的建立，以及 start() 和 shutdown() 如何處理 exporter 的生命週期。

今天，就讓我們來看當一筆 OTLP 格式的資料進入 collector 後，exporter 如何將它轉換成 ClickHouse 可以寫入的格式？回顧昨天提到的 createMetricExporter 函式，裡面剛好就有呼叫到核心的資料轉換函式：

return exporterhelper.NewMetrics(
    ctx, set, cfg,
    exp.pushMetricsData, 
    // ...
)

這個 pushMetricsData 就是資料轉換的核心。今天我們將深入這個函式來了解：

OTLP 的資料結構：metrics 在 OTLP 中如何表示？
Schema Mapping：如何將 OTLP 的巢狀結構攤平成 ClickHouse 的 table schema？
Batch Insert 策略：如何高效地批次寫入資料？
對 Lakehouse 的啟發：這些設計如何應用到 Parquet/Iceberg？

由於各個 signal 所包含的資訊不盡相同，因此在今天的原始碼介紹中，我們會以 metrics 作為範例。

從 `pushMetricsData` 來看轉換流程

當 collector 收到一批 metrics 資料時，collector 便會呼叫 pushMetricsData 這個函式，這個函式傳入的參數有兩個，分別是用來控制超時和取消操作的 ctx 以及型別為 pmetric.Metrics 的參數 md，是 OTLP 格式 metrcis 資料。

func (e *metricsExporter) pushMetricsData(ctx context.Context, md pmetric.Metrics) error

OTLP Metrics 的資料結構

在深入轉換邏輯前，我們需要先理解 OTLP metrics 的層次結構。pmetric.Metrics 是一個多層巢狀的資料結構：

MetricsData
└── ResourceMetrics (repeated)
    ├── Resource (資源屬性，如 service.name)
    └── ScopeMetrics (repeated)
        ├── Scope (instrumentation scope)
        └── Metric (repeated)
            ├── Name (metric 名稱)
            ├── Description
            ├── Unit
            └── Data (根據 metric type 不同)
                ├── Gauge
                ├── Sum
                ├── Histogram
                ├── ExponentialHistogram
                └── Summary

這樣的資料結構所代表的意義為：

ResourceMetrics：一個 Resource 代表一個資料來源（例如一個 service instance）。同一個 service 的所有 metrics 共享相同的 Resource attributes
ScopeMetrics：一個 Scope 代表一個 instrumentation library（例如 HTTP client library）。這樣可以追蹤 metrics 的來源
Metric：實際的指標資料，一個 Metric 可以包含多個 data points

展開 OTLP 格式的巢狀結構

如同前面提過，columnar database的 table 是扁平(flat)的，而 ClickHouse 也不例外。因此，pushMetricsData 的主要工作就是把 OTLP 這個巢狀架構的資料給展開，符合 ClickHouse table 的架構：

func (e *metricsExporter) pushMetricsData(ctx context.Context, md pmetric.Metrics) error {
	metricsMap := metrics.NewMetricsModel(e.tablesConfig, e.cfg.database())
	for i := 0; i < md.ResourceMetrics().Len(); i++ {
		metrics := md.ResourceMetrics().At(i)
		resAttr := metrics.Resource().Attributes()
		for j := 0; j < metrics.ScopeMetrics().Len(); j++ {
			rs := metrics.ScopeMetrics().At(j).Metrics()
			scopeInstr := metrics.ScopeMetrics().At(j).Scope()
			scopeURL := metrics.ScopeMetrics().At(j).SchemaUrl()
			for k := 0; k < rs.Len(); k++ {
				r := rs.At(k)
				var errs error
				//exhaustive:enforce
				switch r.Type() {
				case pmetric.MetricTypeGauge:
					errs = errors.Join(errs, metricsMap[pmetric.MetricTypeGauge].Add(resAttr, metrics.SchemaUrl(), scopeInstr, scopeURL, r.Gauge(), r.Name(), r.Description(), r.Unit()))
				case pmetric.MetricTypeSum:
					errs = errors.Join(errs, metricsMap[pmetric.MetricTypeSum].Add(resAttr, metrics.SchemaUrl(), scopeInstr, scopeURL, r.Sum(), r.Name(), r.Description(), r.Unit()))
				case pmetric.MetricTypeHistogram:
					errs = errors.Join(errs, metricsMap[pmetric.MetricTypeHistogram].Add(resAttr, metrics.SchemaUrl(), scopeInstr, scopeURL, r.Histogram(), r.Name(), r.Description(), r.Unit()))
				case pmetric.MetricTypeExponentialHistogram:
					errs = errors.Join(errs, metricsMap[pmetric.MetricTypeExponentialHistogram].Add(resAttr, metrics.SchemaUrl(), scopeInstr, scopeURL, r.ExponentialHistogram(), r.Name(), r.Description(), r.Unit()))
				case pmetric.MetricTypeSummary:
					errs = errors.Join(errs, metricsMap[pmetric.MetricTypeSummary].Add(resAttr, metrics.SchemaUrl(), scopeInstr, scopeURL, r.Summary(), r.Name(), r.Description(), r.Unit()))
				case pmetric.MetricTypeEmpty:
					return errors.New("metrics type is unset")
				default:
					return errors.New("unsupported metrics type")
				}
				if errs != nil {
					return errs
				}
			}
		}
	}

	return metrics.InsertMetrics(ctx, e.db, metricsMap)
}

可以看到這個函式用了三層迴圈來處理資料，而每一層迴圈都可以對應到 Metrics Data 的架構：