iT邦幫忙

observability相關文章
共有 157 則文章
鐵人賽 DevOps DAY 7

技術 【Day 7】探討 Prompt Engineering:LLM 的入門磚

概述 在先前的章節中,我們已經深入探討了大型語言模型(LLM)在可觀測性領域中的定位與重要性。我們認識到:LLM 可觀測性的核心,在於如何評估其輸出的不確定性...

鐵人賽 DevOps DAY 6

技術 【Day 6】OpenTelemetry 對於 LLM 可觀測性的重要性

概述 在上一篇文章中,我們深入探討了 LLM 應用的獨特性。它是一個機率性的、以語義為核心的「黑盒子」。我們意識到,傳統的監控手段已無法應對其在遙測、輸出、成...

鐵人賽 DevOps DAY 5

技術 【Day 5】認識 LLM 可觀測性:迎接挑戰的第一課

概述 在過去幾篇文章中,我們從傳統監控一路聊到「可觀測性 2.0」,並探討了為何像 ClickHouse 這樣的 OLAP 資料庫會成為新時代的基石。這一切的...

鐵人賽 DevOps DAY 4

技術 【Day 4】可觀測性2.0的明日之星 - ClickHouse

概述 在上一篇文章中,我們探討了從傳統監控邁向『可觀測性 2.0』的關鍵轉變,其核心在於能夠應對海量、高基數的遙測資料,並進行即時的探索式分析。這對後端的資料...

鐵人賽 DevOps DAY 3

技術 【Day 3】傳統可觀測性與可觀測性 2.0:只是另一個 Buzzword?

概述 天下分久必合,合久必分。軟體世界從不缺乏閃亮的新名詞,尤其在微服務與雲原生逐漸成為主流的這些年,可觀測性(Observability) 和 分佈式追蹤(...

鐵人賽 DevOps DAY 2

技術 【Day 2】可觀測性與監控是什麼?

概述 多年來,IT 監控以各種方式被應用和部署。其核心目的是收集有關不只是 IT 基礎設施以及雲原生服務的硬體和軟體運作指標,確保所有關鍵功能都能順利運作,進...

鐵人賽 DevOps DAY 1

技術 【Day 1】探索 LLM 可觀測性之旅

前言 2025 年可以說是 LLM 應用真正大放異彩的一年。原因在於,LLM 的使用場景早已不再侷限於像 ChatGPT 這樣的網頁聊天視窗,如今它已經延伸到...

鐵人賽 DevOps DAY 20

技術 Day 20|Observability 全面監控:Prometheus × Grafana × ELK

●前言 Day 20,代表第一階段的壓軸登場。 前面我們用 Terraform × Helm × CI/CD,已經能自動化建 Infra、部署應用。 但 Dev...

技術 Grafana k6 入門實戰

完整內容在此, 幹話王_Grafana k6 入門實戰 將 k6 從設計測試到開發再到 CI pipeline 整個完整寫一篇。 2024年9月,Grafan...

技術 Docker 環境中用 Pumba 進行混沌測試

完整內容在此, 幹話王_Docker 環境中用 Pumba 進行混沌測試 Chaos Engineering 「混沌不是深淵,而是發現系統韌性的鏡子」 混...

技術 k6 也能寫瀏覽器測試 !

完整內容在此, 幹話王_Grafana k6 browser testing 既上一篇的 xk6今天分享 k6 也能寫瀏覽器測試 ! Grafana k6 B...

鐵人賽 DevOps

技術 後 Grafana 時代的第三十一天 - AlertSnitch 告警歷史可視化的利器

前言 在本系列文章中,我著重於如何透過良好的告警事件管理來減輕維運人員的負擔,並降低 MTTR(平均修復時間)等關鍵指標。維運人員常見的告警痛點包括:告警疲勞(...

鐵人賽 DevOps DAY 30
Grafana Zero to Hero 系列 第 30

技術 Grafana Zero to Hero - 總結:Hero's Journey

英雄旅程(Hero's journey)是廣泛應用在各種故事中的戲劇結構,描述主角如何突破困境最後成為英雄。神話學家 Joseph Campbell 在 194...

鐵人賽 DevOps DAY 30

技術 後 Grafana 時代的第三十天 - 一個時代的終結,也是另一個開始

完賽心得 鐵人賽挑戰的最後一天終於到來了。相比於前兩年的參賽經驗,我今年投入了更多的時間和精力,即便提前兩個半月開始準備,依然寫到了最後一天才完成所有內容。...

鐵人賽 DevOps DAY 29

技術 後 Grafana 時代的第二十九天 - 探討 Grafana 告警事件中心架構設計

前言 在前面的章節中,我們已經對告警事件中心有了初步的了解,並介紹了告警處理的核心服務,包括 Prometheus Alertmanager 和 Grafan...

鐵人賽 DevOps DAY 28

技術 後 Grafana 時代的第二十八天 - 探討 Grafana OnCall 告警待命通知管理

前言 在之前探討告警事件中心的章節中,我們已經對 Prometheus AlertManager 和 Grafana Alerting 有了基本的了解。雖然這...

鐵人賽 DevOps DAY 27

技術 後 Grafana 時代的第二十七天 - 探討 Grafana Alerting 告警歷史與列表

前言 在一個複雜的系統中,告警事件的歷史紀錄是非常重要的。它不僅可以幫助我們了解系統的穩定性,還可以幫助我們找出系統的瓶頸和潛在的問題。Grafana Ale...

鐵人賽 DevOps DAY 26

技術 後 Grafana 時代的第二十六天 - 探討 Grafana Alerting 的正確姿勢(二)

前言 在前一章節中,我們已經詳盡地介紹了設定告警規則的各種細節,並深入了解了告警規則在評估過程中所經歷的不同狀態變化及其所代表的意義。經過這一番學習,相信你已...

鐵人賽 DevOps DAY 25

技術 後 Grafana 時代的第二十五天 - 探討 Grafana Alerting 的正確姿勢(一)

前言 在經過了先前對於 Grafana Alerting 與 Prometheus AlertManager 的介紹後,我們對於告警事件系統的觀念已經有了基本...

鐵人賽 DevOps DAY 24

技術 Day 24:GitLab Product Direction - Monitor:Observability

(時間不太夠,所以昨天預告的 Portfolio Management 範例我們改天再聊,今天先用一個比較小的主題讓我再次喘息一下。) 今天我們來看另一個 Gi...

鐵人賽 DevOps DAY 24

技術 後 Grafana 時代的第二十四天 - 探討 Grafana Alerting 有趣的部分

前言 在現代可觀測性世界中,告警事件管理是確保服務穩定運行的關鍵,無論是雲端、地端以及各種分佈式系統中,精準即時的告警能夠幫助我們快速發相問題,接著進行故障排...

鐵人賽 DevOps DAY 22

技術 後 Grafana 時代的第二十二天 - 探討 Prometheus AlertManager 的正確姿勢(一)

前言 現代化系統中,監控與告警系統在日益複雜的服務環境中扮演著至關重要的角色。而我們在這背景下,以 AlertManager 這個百分之九十以上與 Prome...

鐵人賽 Modern Web DAY 22

技術 靠 Grafana 吃飯的第二十二天 - 前端除了監控還需要可觀測性

前言 我們在前三章的介紹中,深入地了解前端的監控以及 Web Vitals 的相關知識。在前端開發中,許多開發者已經熟悉了各種監控工具,這些工具可以幫助我們了...

鐵人賽 DevOps DAY 21

技術 後 Grafana 時代的第二十一天 - 探討告警事件中心的最佳實踐

前言 現今的市面上已經擁有眾多的的監控系統,如 Prometheus、Grafana、Zabbix、Datadog、New Relic 等等,這些監控系統各自...

鐵人賽 DevOps DAY 20

技術 後 Grafana 時代的第二十天 - 探討告警事件中心的重要性

前言 我們在先前的章節中已經探討了非常多關於 Grafana IaC 的實踐與應用,包括了如何使用 Grafana IaC 來管理 Grafana 的資源,以...

鐵人賽 DevOps DAY 19

技術 後 Grafana 時代的第十九天 - Gafana IaC 實戰 - Alerting

前言 現在,我們將進入到 Grafana 的告警系統的 IaC 實作部分。這部份是 Grafana 中相對複雜的部份,需要對告警系統有一定的了解,才能夠更好地...

鐵人賽 DevOps DAY 18

技術 後 Grafana 時代的第十八天 - Gafana IaC 實戰 - Dashboard、Folder

前言 在前面的章節中,我們深入探討了 Grafana 中組織、團隊和用戶的 IaC 管理。現在,我們將把注意力轉向 Grafana 的核心功能之一:Dashb...

鐵人賽 DevOps DAY 17

技術 後 Grafana 時代的第十七天 - Gafana IaC 實戰 - DataSource

引言 在現代監控和可觀測性領域,Grafana 已成為不可或缺的視覺化平台。隨著組織規模的擴大和監控需求的增加,有效管理 Grafana 的資料來源變得越來越...

鐵人賽 DevOps DAY 16

技術 後 Grafana 時代的第十六天 - Gafana IaC 實戰 - Organization、Team、User

前言 在前面的章節中,我們已經深入探討了實現 Grafana IaC 相關的核心概念和注意事項,這為後續的實作打下了良好的基礎。這也呼應了本系列文章的主題,隨...

鐵人賽 DevOps DAY 15

技術 後 Grafana 時代的第十五天 - Gafana IaC 實戰 - 使用 Terraform 動態產生 Grafana 資源

前言 Terraform 是一個功能強大的基礎設施即程式碼(Infrastructure as Code, IaC)工具,可用於自動建立、維護和刪除雲端資源。...