iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
DevOps

被稱作Server Restart Engineer的我,也想了解如何實踐可觀測性工程 系列

從Prometheus, Grafana再到ELK stack, 把工具都摸過一輪之後,發現自己侷限於工具的使用,卻沒有好好了解可觀測性工程是什麼?它又該如何在工作現場當中實踐?本系列文將從我們熟知的三本柱metrics, traces, logs出發,深入探討它們各自的價值與局限。接著進入OpenTelemetry的世界,不只學習怎麼用,更要理解它背後想實踐的可觀測性精神。最後,我們會討論如何選擇適合的資料儲存後端,以及如何從零開始規劃一個真正符合團隊現況的可觀測性系統架構。

參賽天數 23 天 | 共 23 篇文章 | 3 人訂閱 訂閱系列文 RSS系列文 團隊動鼠做
DAY 1

Day 01 - 前言

作為一名半路出家的工程師,去年因為工作需要,開始關注業界在實踐可觀測性工程的方法以及心得。從 observability 1.0、2.0 到現在 3.0 問世,...

2025-09-15 ‧ 由 Sophie 分享
DAY 2

Day 02 - 淺談監控方法論

可觀測性與監控 在講述可觀測性是什麼之前,我想先和各位來談談監控(Monitoring)。在《可觀測性工程:達成卓越營運》書中提到,當我們將監控和可觀測性混為一...

2025-09-16 ‧ 由 Sophie 分享
DAY 3

Day 03 - 什麼是可觀測性?

可觀測性這個名詞最早用於控制系統領域,由工程師 Rudolf Emil Kálmán 所提出。他主張可觀測性(observability)是指外部可以透過輸出訊...

2025-09-17 ‧ 由 Sophie 分享
DAY 4

Day 04 - Observability 2.0 的資料觀點:統一的結構化日誌

當我們在談論 Observability 2.0 時,最核心的轉變其實是「資料的定義」。 在 1.0 的思維裡,我們習慣把 Observability 和 Me...

2025-09-18 ‧ 由 Sophie 分享
DAY 5

Day 05 - OpenTelemetry 的設計理念

Observability 2.0 想傳遞的精神當中,其中一項就是不希望可觀測性實踐被工具所綁定。我們該如何確保可觀測性系統是能隨時切換或者擴展儲存後端的呢?...

2025-09-19 ‧ 由 Sophie 分享
DAY 6

Day 06 - OpenTelemetry: Collector 的元件架構

Component 介紹 昨天,我們大致了解了 OpenTelemetry 的設計理念,以及它是如何讓這些理念落地的。今天,讓我們從負責 OpenTelemet...

2025-09-20 ‧ 由 Sophie 分享
DAY 7

Day 07 - OpenTelemetry: Collector 的部署策略

本篇文章將延續昨天的 Collector 元件介紹,探討將 Collector 部署到生產環境時的幾個策略。 根據官方文件,Collector 的部署可分為三種...

2025-09-21 ‧ 由 Sophie 分享
DAY 8

Day 08 - OpenTelemetry: Instrumentation 讓你的服務產生 telemetry 資料

昨天,我們了解了 Collector 如何扮演一個 data pipeline 的角色,它可以收集來自不同來源的 telemetry,集中處理後送往不同的儲存後...

2025-09-22 ‧ 由 Sophie 分享
DAY 9

Day 09 - OpenTelemetry Signal: Metrics Data Model 與元件介紹

OpenTelemetry 中的 signal 雖然在前幾個章節,有提到 Observability 2.0 期望打破三大支柱的概念,回歸到資料本身來做處理與觀...

2025-09-23 ‧ 由 Sophie 分享
DAY 10

Day 10 - OpenTelemetry Signal: Logs 不重複造輪的設計精神

相較於 metrics 與 traces,logs 算是在這些 signals 當中使用最普及的。許多程式語言幾乎都有自己內建的函式庫以支援輸出 log,同時業...

2025-09-24 ‧ 由 Sophie 分享