繼前面幾篇文章教大家怎麼安裝 Filebeat (Logs)、Metricbeat (Metrics)、APM (Apm) 後,這篇文章將淺談 Observability 及四大功能 Logs、Metrics、Apm、Uptime。
目標是可以偵測並快速找到服務的停機時間、錯誤、回應過慢的可能原因,讓系統達到:
Observability 可以看成是其中一種搜尋案例,主要
Observability 的目的是幫助我們快速找到問題,幾個名詞定義
舉例來說最後我們的目標就會是希望某個系統的 Uptime 維持在 95%,並在低於 95% 的時候有相關紀錄甚至是提供告警的機制。
如果是 DevOops 或是系統維運的團隊,會需要監控機台的相關資訊,前面幾篇文章有介紹怎麼安裝使用 Elastic Cloud 提供的 Filebeat (Logs)、Metricbeat (Metrics)、APM (Apm) 去進行資料蒐集與系統和服務監控。
舉例來說如果今天我們使用 Nginx 當成我們的附載平衡伺服器時,我們可以安裝:
在我們照著相關範例啟動並查看 Dashborad 時,會發現 ECS (Elastic Common Schema) 這個名詞,ESC 是一種新規格,讓使用者以一致、可定義的方式整理 Elasticsearch 中資料結構,協助分析不同來源的數據。
透過 ECS,使用者可以更方便的去使用儀錶板或是 Machine Learning 等工具分析内容,更方便的去建立並搜尋。
方便的 Observability 工具讓我們可以更容易地監控機器與服務,進一步也可以透過 Elastic Cloud 提供的機器學習視覺化工具去分析了解我們的指標或資料。