分布式可觀測性 Tracing、Time Series Data、LSM淺談

13th鐵人賽 tracing lsm time series data

雷N

2021-10-08 00:07:04

1966 瀏覽

分享至

上篇回顧
分布式可觀測性 Logging 淺談
 分布式可觀測性 Structured Log
分布式可觀測性 Metrics 淺談
繼續淺談Observability的最後一個基石

Trace

單體架構下, 基本上調用關係僅在同一個process的記憶體內做調用, 通常都是透過stack trace做調用鍊路的trace.
將這些資訊給匯出後, 再通過類似Flame Graph的工具, 進行可觀測性的分析. 也可透過圖, 來得知調用關係.
FlameGraph

但是在Distributed System下常常, 服務之間相互調用, 其調用的機器與網路甚至不是同一個.
一樣也是要透過調用鍊路收集的工具, 把Distributed System的調用鍊路整成一個跟stack trace很像的結構與資訊. 其中也包含每個調用鍊路的耗時時長.
這就是Distributed Tracing, 能參考去年我的文章Distributed Tracing & OpenTelemetry介紹

Time Series Data

前面兩個維度講的資料, 都是以Time Series Data的方式呈現.
Time Series Data反應的是Metric指標在某一個時間點上的狀態.
這種資料與MySQL這類的OLTP資料有所不同.

資料不可變
只有一直生成新數據, 不會去修改舊數據, 時間過了, 改變過去沒意義
按照時間依序生成一系列的數據
必備的欄位有Timestamp, 還會加上少說一個主要欄位(服務名稱,設備名稱...)當作索引
通常數據量比OLTP的數據龐大非常多
這些指標數據, 通常會以1s的間隔做聚合, 換句話說就是看同一秒內機器的整體效能, 或是服務的效能
通常只對近期數據做關注, 一陣子以前的通常非常非常少被存取
Metric指標或Label標籤要能被Aggregation聚合, 計算平均值、Maximum、Minimum之類的

Time Series Data會有一些獨特的概念

Metric 指標
- 被監控的對象, 溫度、速率、反應時間...
- 一個Metric可以有多個Tag
- 有幾種Type, 可參考Prometheus給的
Label/Tag 標籤
- 對指標特徵維度的說明
- Key Value形式呈現
- path=/Order -> 表示這metric是針對api/order的可能counter可能是respone time的取樣, 要看metric是什麼
- 所以若是Log沒以Structured Log格式呈現, 不方便取Key來當這Label的Key

所以 Metric+Label決定了一個計量的單位.
如果以MySQL來存放, 那一個Metric就會是一張表了, Label則是裡面的欄位, 可能還會有其他欄位像是Timestamp.

再來MySQL這類的資料庫, 通常以B+Tree做資料存儲結構, 通常會以讀取的順序依序做排序,

因為B+Tree預設是為了對磁碟做存取操作的, 它所有資料都存在Leaf葉子節點中.
每次查詢時, 需要從Root節點查詢到Leaf節點, 在從Leaf節點對應的位子進行讀取, 其存放的順序剛好跟讀取所需要的順序是一致的. 然後Leaf節點的資料是放在磁碟內的Page, 讀取一整個page出來後放到Memory中.
但沒人說物理Page剛好位子都是相鄰的.
這樣的結構好處是插入刪除的時間複雜度是O(log2N), 查詢要看情況, 可以非常好也能很不好.
這種隨機讀寫的場景蠻常見的, 會導致時間大多花在磁盤尋址上.