概述 在先前的章節中,我們已經深入探討了大型語言模型(LLM)在可觀測性領域中的定位與重要性。我們認識到:LLM 可觀測性的核心,在於如何評估其輸出的不確定性...
概述 在上一篇文章中,我們深入探討了 LLM 應用的獨特性。它是一個機率性的、以語義為核心的「黑盒子」。我們意識到,傳統的監控手段已無法應對其在遙測、輸出、成...
概述 在過去幾篇文章中,我們從傳統監控一路聊到「可觀測性 2.0」,並探討了為何像 ClickHouse 這樣的 OLAP 資料庫會成為新時代的基石。這一切的...
概述 在上一篇文章中,我們探討了從傳統監控邁向『可觀測性 2.0』的關鍵轉變,其核心在於能夠應對海量、高基數的遙測資料,並進行即時的探索式分析。這對後端的資料...
概述 天下分久必合,合久必分。軟體世界從不缺乏閃亮的新名詞,尤其在微服務與雲原生逐漸成為主流的這些年,可觀測性(Observability) 和 分佈式追蹤(...
概述 多年來,IT 監控以各種方式被應用和部署。其核心目的是收集有關不只是 IT 基礎設施以及雲原生服務的硬體和軟體運作指標,確保所有關鍵功能都能順利運作,進...
前言 2025 年可以說是 LLM 應用真正大放異彩的一年。原因在於,LLM 的使用場景早已不再侷限於像 ChatGPT 這樣的網頁聊天視窗,如今它已經延伸到...
●前言 Day 20,代表第一階段的壓軸登場。 前面我們用 Terraform × Helm × CI/CD,已經能自動化建 Infra、部署應用。 但 Dev...
完整內容在此, 幹話王_Grafana k6 入門實戰 將 k6 從設計測試到開發再到 CI pipeline 整個完整寫一篇。 2024年9月,Grafan...
完整內容在此, 幹話王_Docker 環境中用 Pumba 進行混沌測試 Chaos Engineering 「混沌不是深淵,而是發現系統韌性的鏡子」 混...
完整內容在此, 幹話王_Grafana k6 browser testing 既上一篇的 xk6今天分享 k6 也能寫瀏覽器測試 ! Grafana k6 B...
前言 在本系列文章中,我著重於如何透過良好的告警事件管理來減輕維運人員的負擔,並降低 MTTR(平均修復時間)等關鍵指標。維運人員常見的告警痛點包括:告警疲勞(...
英雄旅程(Hero's journey)是廣泛應用在各種故事中的戲劇結構,描述主角如何突破困境最後成為英雄。神話學家 Joseph Campbell 在 194...
完賽心得 鐵人賽挑戰的最後一天終於到來了。相比於前兩年的參賽經驗,我今年投入了更多的時間和精力,即便提前兩個半月開始準備,依然寫到了最後一天才完成所有內容。...
前言 在前面的章節中,我們已經對告警事件中心有了初步的了解,並介紹了告警處理的核心服務,包括 Prometheus Alertmanager 和 Grafan...
前言 在之前探討告警事件中心的章節中,我們已經對 Prometheus AlertManager 和 Grafana Alerting 有了基本的了解。雖然這...
前言 在一個複雜的系統中,告警事件的歷史紀錄是非常重要的。它不僅可以幫助我們了解系統的穩定性,還可以幫助我們找出系統的瓶頸和潛在的問題。Grafana Ale...
前言 在前一章節中,我們已經詳盡地介紹了設定告警規則的各種細節,並深入了解了告警規則在評估過程中所經歷的不同狀態變化及其所代表的意義。經過這一番學習,相信你已...
前言 在經過了先前對於 Grafana Alerting 與 Prometheus AlertManager 的介紹後,我們對於告警事件系統的觀念已經有了基本...
(時間不太夠,所以昨天預告的 Portfolio Management 範例我們改天再聊,今天先用一個比較小的主題讓我再次喘息一下。) 今天我們來看另一個 Gi...
前言 在現代可觀測性世界中,告警事件管理是確保服務穩定運行的關鍵,無論是雲端、地端以及各種分佈式系統中,精準即時的告警能夠幫助我們快速發相問題,接著進行故障排...
前言 現代化系統中,監控與告警系統在日益複雜的服務環境中扮演著至關重要的角色。而我們在這背景下,以 AlertManager 這個百分之九十以上與 Prome...
前言 我們在前三章的介紹中,深入地了解前端的監控以及 Web Vitals 的相關知識。在前端開發中,許多開發者已經熟悉了各種監控工具,這些工具可以幫助我們了...
前言 現今的市面上已經擁有眾多的的監控系統,如 Prometheus、Grafana、Zabbix、Datadog、New Relic 等等,這些監控系統各自...
前言 我們在先前的章節中已經探討了非常多關於 Grafana IaC 的實踐與應用,包括了如何使用 Grafana IaC 來管理 Grafana 的資源,以...
前言 現在,我們將進入到 Grafana 的告警系統的 IaC 實作部分。這部份是 Grafana 中相對複雜的部份,需要對告警系統有一定的了解,才能夠更好地...
前言 在前面的章節中,我們深入探討了 Grafana 中組織、團隊和用戶的 IaC 管理。現在,我們將把注意力轉向 Grafana 的核心功能之一:Dashb...
引言 在現代監控和可觀測性領域,Grafana 已成為不可或缺的視覺化平台。隨著組織規模的擴大和監控需求的增加,有效管理 Grafana 的資料來源變得越來越...
前言 在前面的章節中,我們已經深入探討了實現 Grafana IaC 相關的核心概念和注意事項,這為後續的實作打下了良好的基礎。這也呼應了本系列文章的主題,隨...
前言 Terraform 是一個功能強大的基礎設施即程式碼(Infrastructure as Code, IaC)工具,可用於自動建立、維護和刪除雲端資源。...