iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 28
0
DevOps

30天完成本地部署 kubernetes系列 第 28

部署監控系統 netdata+prometheus+grafana

使用 kubernetes 可擴展運算資源。使用 ceph 可擴展儲存資源。當節點愈來愈多時,使用監控系統以快速確認群集是否運作正常。

以下說明使用 netdata+prometheus+grafana 部署監控系統的步驟。

監控對象的組態檔準備

在部署監控前,需準備 prometheus.yml,以告知 prometheus 待監控的對象為何。

  1. 針對主機節點

執行 netdata 後,在該主機上可透過 port 19999 提供 netdata metrics。

在 prometheus.yml 中,透過 static_configs 指定該主機的監控指標:

    static_configs:
      - targets: ['host-name:19999']
  1. 針對 ceph 集群

ceph 的 mgr 提供 prometheus module。使用以下指令啟用該功能:

$ ceph mgr module enable prometheus

即可透過 port 9283 提供 ceph metrics。

在 prometheus.yml 中,透過 static_configs 指定 ceph 的監控指標:

    static_configs:
      - targets: ['ceph-mgr:9283']

部署監控系統

  1. 首先,在每個節點上執行 netdata。
docker run -d --cap-add SYS_PTRACE \
        --security-opt seccomp:unconfined --security-opt apparmor:unconfined \
        --restart=always \
        -v /proc:/host/proc:ro \
        -v /sys:/host/sys:ro \
        -v /var/run/docker.sock:/var/run/docker.sock:ro \
        --network=host \
        titpetric/netdata:1.15.0
  1. 選擇一個監控節點,以執行 prometheus。
docker run -d \
        --restart=always \
        --network=host \
        -v ${PWD}/prometheus.yml:/etc/prometheus/prometheus.yml \
        prom/prometheus:v2.11.1 \
                --storage.tsdb.retention.time=15d \
                --config.file=/etc/prometheus/prometheus.yml
  1. 在監控節點上執行 grafana。
docker run -d \
        --restart=always \
        --network=host \
        grafana/grafana:6.3.2

參考

  1. https://docs.ceph.com/docs/master/mgr/prometheus/

上一篇
異質節點的硬體資源管理(4):依節點的運算能力進行調度
下一篇
實機本地部署完畢的運作情形範例
系列文
30天完成本地部署 kubernetes30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言