Day27 - 融會貫通：建立整合 Logs, Traces 與 Metrics 的 Grafana 儀表板 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2025 iThome 鐵人賽

DAY 27

DevOps

Vibe Coding 後的挑戰：Locust x Loki 負載及監控系列第 27 篇

Day27 - 融會貫通：建立整合 Logs, Traces 與 Metrics 的 Grafana 儀表板

17th鐵人賽

熊熊工程師

團隊一蘭拉麵基本配料 5 倍辣

2025-09-15 09:02:26

120 瀏覽

分享至

經過前面幾天的學習，我們已經分別掌握了日誌 (Loki)、追蹤 (Tempo) 和指標 (Mimir) 這三大可觀測性的支柱。今天，我們將迎來一個激動人心的里程碑：將這三者融會貫通，在 Grafana 中建立一個統一的儀表板，真正實現「單一窗格 (Single Pane of Glass)」的監控體驗。

為什麼需要統一儀表板？

在傳統的監控中，指標、日誌和追蹤通常是孤立的系統。當問題發生時，工程師需要在不同的系統和界面之間來回切換，試圖手動將線索拼湊起來。這個過程非常耗時且效率低下。

一個統一的儀表板可以讓我們：

快速關聯: 在同一個時間軸上查看指標的異常、相關的錯誤日誌以及導致問題的完整追蹤鏈路。
縮短 MTTR (平均解決時間): 從發現問題（例如，指標告警）到定位根本原因（例如，某個追蹤中的一個慢查詢），整個流程都在一個界面中完成。
團隊協作: 開發、維運和 SRE 團隊可以共享同一個視圖，使用共同的語言來溝通問題。

操作方式與步驟

步驟一：建立檔案結構

首先，請在 day27 目錄下建立以下的檔案與資料夾結構。所有檔案的內容請參考下方的「完整設定檔內容」章節。

day27/
├── docker-compose.yml
├── loki-config.yaml
├── mimir-config.yaml
├── prometheus.yml
├── README.md
└── grafana-provisioning/
    ├── datasources/
    │   └── datasource.yml
    └── dashboards/
        ├── dashboard.yml
        └── main-dashboard.json

步驟二：啟動所有服務

確認所有檔案都已建立並填入正確內容後，在 day27 的根目錄下，執行以下 Docker Compose 命令來啟動所有服務。

# -d 參數會讓服務在背景執行
docker-compose up -d

服務啟動後，Grafana 會自動根據設定檔完成以下兩件事：

配置資料來源: 自動設定好 Loki, Mimir, 和 Tempo 的資料來源。
載入儀表板: 自動載入我們預先定義好的整合儀表板。

步驟三：探索整合儀表板

開啟 Grafana: 在您的瀏覽器中訪問 http://localhost:3000。
找到儀表板: 點擊左側選單的 Dashboards 圖示，您應該能看到一個名為 Day 27: Unified Dashboard 的儀表板，直接點擊進入。

儀表板構成

這個儀表板被分成了兩個部分：

指標面板 (Metrics Panel): 左側的 Mimir: HTTP Requests Total 面板顯示了從 Mimir 查詢到的指標數據。這是我們監控系統健康狀況的「高層視圖」。
日誌面板 (Logs Panel): 右側的 Loki: Logs 面板顯示了從 Loki 查詢到的日誌數據。當我們在指標面板發現異常時，可以立刻查看同一時間範圍內的日誌。

如何關聯分析？

這就是整合儀表板的魔力所在。想像一個典型的問題排查場景：

發現異常: 您在指標面板上看到請求率突然暴增。
尋找線索: 您將滑鼠懸停在圖表的高峰點，右側的日誌面板會自動滾動到相應時間點的日誌，幫助您尋找錯誤訊息或異常行為。
深入追蹤: 如果日誌中包含了 trace_id（我們在 datasource.yml 中已設定好關聯），您在日誌面板中點擊它，就可以直接跳轉到 Tempo，查看導致這條錯誤日誌的完整分散式追蹤鏈路。

完整設定檔內容

以下是本次練習需要用到的所有設定檔的完整內容。

`docker-compose.yml`

version: '3.8'

services:
  loki:
    image: grafana/loki:2.9.0
    ports:
      - "3100:3100"
    volumes:
      - ./loki-config.yaml:/etc/loki/local-config.yaml
    command: -config.file=/etc/loki/local-config.yaml

  tempo:
    image: grafana/tempo:2.2.0
    ports:
      - "3200:3200" # Tempo
      - "4317:4317" # OTLP gRPC

  mimir:
    image: grafana/mimir:2.9.0
    ports:
      - "9009:9009"
    volumes:
      - ./mimir-config.yaml:/etc/mimir.yaml
      - mimir-data:/data/mimir
    command: -config.file=/etc/mimir.yaml

  prometheus:
    image: prom/prometheus:v2.47.0
    ports:
      - "9090:9090"
    volumes:
      - ./prometheus.yml:/etc/prometheus/prometheus.yml
    command: --config.file=/etc/prometheus/prometheus.yml

  grafana:
    image: grafana/grafana:10.0.3
    ports:
      - "3000:3000"
    volumes:
      - ./grafana-provisioning/datasources:/etc/grafana/provisioning/datasources
      - ./grafana-provisioning/dashboards:/etc/grafana/provisioning/dashboards

volumes:
  mimir-data:

`loki-config.yaml`

auth_enabled: false

server:
  http_listen_port: 3100

common:
  instance_addr: 127.0.0.1
  path_prefix: /tmp/loki
  storage:
    filesystem:
      chunks_directory: /tmp/loki/chunks
      rules_directory: /tmp/loki/rules
  replication_factor: 1
  ring:
    kvstore:
      store: inmemory

schema_config:
  configs:
    - from: 2020-10-24
      store: boltdb-shipper
      object_store: filesystem
      schema: v11
      index:
        prefix: index_
        period: 24h

`mimir-config.yaml`

target: all
auth_enabled: false

server:
  http_listen_port: 9009
  grpc_listen_port: 9095

distributor:
  ring:
    instance_addr: 127.0.0.1
    kvstore:
      store: inmemory

ingester:
  ring:
    instance_addr: 127.0.0.1
    kvstore:
      store: inmemory
    replication_factor: 1
  lifecycler:
    ring:
      kvstore:
        store: inmemory
      replication_factor: 1
    final_sleep: 0s
  max_transfer_retries: 0

ruler:
  alertmanager_url: http://localhost
  ring:
    kvstore:
      store: inmemory

blocks_storage:
  backend: filesystem
  filesystem:
    dir: /data/mimir/blocks

compactor:
  data_dir: /data/mimir/compactor
  sharding_ring:
    kvstore:
      store: inmemory

store_gateway:
  sharding_ring:
    kvstore:
      store: inmemory

`prometheus.yml`

global:
  scrape_interval: 15s

scrape_configs:
  - job_name: 'prometheus'
    static_configs:
      - targets: ['localhost:9090']

  - job_name: 'mimir'
    static_configs:
      - targets: ['mimir:9009']

remote_write:
  - url: "http://mimir:9009/api/v1/push"

`grafana-provisioning/datasources/datasource.yml`

apiVersion: 1

datasources:
  - name: Loki
    type: loki
    access: proxy
    url: http://loki:3100
    jsonData:
      derivedFields:
        - datasourceUid: tempo
          matcherRegex: 'trace_id=(\w+)'
          name: TraceID
          url: '$${__value.raw}'

  - name: Mimir
    type: prometheus
    access: proxy
    url: http://mimir:9009/prometheus
    isDefault: true

  - name: Tempo
    type: tempo
    access: proxy
    url: http://tempo:3200
    jsonData:
      tracesToLogs:
        datasourceUid: 'loki'
        tags: ['job', 'instance', 'pod', 'namespace']
        mappedTags: [{ key: 'service.name', value: 'job' }]
        spanStartTimeShift: '1s'
        spanEndTimeShift: '-1s'

`grafana-provisioning/dashboards/dashboard.yml`

apiVersion: 1

providers:
- name: 'default'
  orgId: 1
  folder: ''
  type: file
  disableDeletion: false
  editable: true
  options:
    path: /etc/grafana/provisioning/dashboards

`grafana-provisioning/dashboards/main-dashboard.json`

{
  "__inputs": [],
  "__requires": [],
  "annotations": {
    "list": [
      {
        "builtIn": 1,
        "datasource": {
          "type": "grafana",
          "uid": "-- Grafana --"
        },
        "enable": true,
        "hide": true,
        "iconColor": "rgba(0, 211, 255, 1)",
        "name": "Annotations & Alerts",
        "type": "dashboard"
      }
    ]
  },
  "editable": true,
  "fiscalYearStartMonth": 0,
  "graphTooltip": 0,
  "id": 1,
  "links": [],
  "liveNow": false,
  "panels": [
    {
      "title": "Mimir: HTTP Requests Total",
      "type": "timeseries",
      "datasource": {
        "type": "prometheus",
        "uid": "mimir"
      },
      "gridPos": {
        "h": 9,
        "w": 12,
        "x": 0,
        "y": 0
      },
      "targets": [
        {
          "datasource": {
            "type": "prometheus",
            "uid": "mimir"
          },
          "expr": "rate(prometheus_http_requests_total[5m])",
          "legendFormat": "{{handler}}"
        }
      ]
    },
    {
      "title": "Loki: Logs",
      "type": "logs",
      "datasource": {
        "type": "loki",
        "uid": "loki"
      },
      "gridPos": {
        "h": 9,
        "w": 12,
        "x": 12,
        "y": 0
      },
      "targets": [
        {
          "datasource": {
            "type": "loki",
            "uid": "loki"
          },
          "expr": "{job=\"mimir\"}"
        }
      ]
    }
  ],
  "schemaVersion": 37,
  "style": "dark",
  "tags": [],
  "templating": {
    "list": []
  },
  "time": {
    "from": "now-1h",
    "to": "now"
  },
  "timepicker": {},
  "timezone": "",
  "title": "Day 27: Unified Dashboard",
  "uid": "day27-unified",
  "version": 1,
  "weekStart": ""
}

總結

今天，我們將可觀測性的三大支柱——指標、日誌和追蹤——整合到了一個統一的 Grafana 儀表板中。我們不僅學習了如何配置這樣一個儀表板，更重要的是理解了它在現代軟體系統監控和故障排查中的巨大價值。

透過這種方式，我們不再是看著孤立的數據點，而是在觀察一個完整的故事。從指標的宏觀趨勢，到日誌的具體細節，再到追蹤的完整上下文，我們擁有了前所未有的洞察力。

至此，我們已經完成了 Grafana 可觀測性技術棧 (Loki, Grafana, Mimir/Metrics, Tempo) 的核心學習路徑。恭喜您！

Day26 - Grafana Mimir 指標系統入門

Day28 - Grafana 進階探索：打造互動式儀表板

系列文

Vibe Coding 後的挑戰：Locust x Loki 負載及監控共 30 篇

RSS系列文訂閱系列文

10 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19865 篇

完賽人數

529 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

Vibe Coding 後的挑戰：Locust x Loki 負載及監控系列 第 27 篇

Day27 - 融會貫通：建立整合 Logs, Traces 與 Metrics 的 Grafana 儀表板

為什麼需要統一儀表板？

操作方式與步驟

步驟一：建立檔案結構

步驟二：啟動所有服務

步驟三：探索整合儀表板

儀表板構成

如何關聯分析？

完整設定檔內容

docker-compose.yml

loki-config.yaml

mimir-config.yaml

prometheus.yml

grafana-provisioning/datasources/datasource.yml

grafana-provisioning/dashboards/dashboard.yml

grafana-provisioning/dashboards/main-dashboard.json

總結