從Prometheus, Grafana再到ELK stack, 把工具都摸過一輪之後,發現自己侷限於工具的使用,卻沒有好好了解可觀測性工程是什麼?它又該如何在工作現場當中實踐?本系列文將從我們熟知的三本柱metrics, traces, logs出發,深入探討它們各自的價值與局限。接著進入OpenTelemetry的世界,不只學習怎麼用,更要理解它背後想實踐的可觀測性精神。最後,我們會討論如何選擇適合的資料儲存後端,以及如何從零開始規劃一個真正符合團隊現況的可觀測性系統架構。
作為一名半路出家的工程師,去年因為工作需要,開始關注業界在實踐可觀測性工程的方法以及心得。從 observability 1.0、2.0 到現在 3.0 問世,...
可觀測性與監控 在講述可觀測性是什麼之前,我想先和各位來談談監控(Monitoring)。在《可觀測性工程:達成卓越營運》書中提到,當我們將監控和可觀測性混為一...
可觀測性這個名詞最早用於控制系統領域,由工程師 Rudolf Emil Kálmán 所提出。他主張可觀測性(observability)是指外部可以透過輸出訊...
當我們在談論 Observability 2.0 時,最核心的轉變其實是「資料的定義」。 在 1.0 的思維裡,我們習慣把 Observability 和 Me...
Observability 2.0 想傳遞的精神當中,其中一項就是不希望可觀測性實踐被工具所綁定。我們該如何確保可觀測性系統是能隨時切換或者擴展儲存後端的呢?...
Component 介紹 昨天,我們大致了解了 OpenTelemetry 的設計理念,以及它是如何讓這些理念落地的。今天,讓我們從負責 OpenTelemet...
本篇文章將延續昨天的 Collector 元件介紹,探討將 Collector 部署到生產環境時的幾個策略。 根據官方文件,Collector 的部署可分為三種...
昨天,我們了解了 Collector 如何扮演一個 data pipeline 的角色,它可以收集來自不同來源的 telemetry,集中處理後送往不同的儲存後...
OpenTelemetry 中的 signal 雖然在前幾個章節,有提到 Observability 2.0 期望打破三大支柱的概念,回歸到資料本身來做處理與觀...
相較於 metrics 與 traces,logs 算是在這些 signals 當中使用最普及的。許多程式語言幾乎都有自己內建的函式庫以支援輸出 log,同時業...