iT邦幫忙

sre相關文章
共有 114 則文章

技術 [SRE×AI #07] SRE 的 Prompt 工程:怎麼讓 AI 按照你的方式調查

AI 很聰明。但它不知道你們的 log 要去哪裡查、哪個 index 對應哪個服務、收到 503 要先看什麼。 AI 很聰明,但它不認識你的系統 前幾篇...

技術 [SRE×AI #06] 一次 Incident 調查的完整旅程:從 Log 到報告的 AI 協作實戰

調查花了 20 分鐘,寫報告又花了 1 小時。最痛的不是查問題,是把查到的東西整理成報告。 以下這份 RCA 報告,是我用 AI 產出的。 背景:Dev...

技術 [SRE×AI #05] Log 查不到的問題,Metrics 幫你抓:Monitoring MCP 實戰

503 錯誤,log 只告訴你「回了 503」。真正的原因,藏在 Prometheus 裡。 Log 不是萬能的 你有沒有遇過這種情況? 收到 503...

技術 [SRE×AI #04] 讓 AI 幫你搜 Confluence、建 Jira:Atlassian MCP 實戰

老闆說「之前有發生過嗎?查一下。」你翻了 10 分鐘 Confluence。查完他又說:「Action items 都開 ticket 追蹤。」 你翻過...

技術 [SRE×AI #03]不再手動 grep 日誌:用 OpenSearch MCP 讓 AI 幫你查

查 log 的終點從來不是那一行 JSON,而是一段 Manager、RD 都看得懂的話 你有沒有被 Log 淹沒過? 你平常怎麼查Log? 打開 Op...

技術 [SRE×AI #02]我如何用 Claude 將故障調查時間從 2 小時縮短到 15 分鐘

我如何用 Claude 將故障調查時間從 2 小時縮短到 15 分鐘 💡 這不是理論,是一個真實的晚上 10 點故障處理全記錄。 又是一個普通的週四晚上...

技術 [SRE×AI #01]AI Agent 時代的 SRE:讓 Claude 成為你的 On-Call 夥伴

AI Agent 時代的 SRE:讓 Claude 成為你的 On-Call 夥伴 💡 晚上 10 點的告警,從手動查詢 2 小時到 AI 協作 15 分鐘...

技術 apigw + blue green 組合技

Sync at : https://hackmd.io/@goish135/sre251123 apigw + blue green 組合技 apigw 用...

技術 維運 API Gateway - 管理力

維運 API Gateway - 管理力 在開發後...之後的故事呢? 在開發後我們怎麼維運這奢華版Proxy,在眾多Gateway或Proxy中殺出一條生路?...

技術 服務可靠性工程的文化

這一篇我們來講一個比較high level的SRE文化如何在組織內實行。 傳統上的IT人員基本上由於組織架構與文化的關係在維護自家IT服務時不太在乎組織外部客戶...

技術 BlueGreen deploy

Catalog backend only frontend only fullend (full stack) issue need to improve n...

徵才 【SHOPLINE 招募中】Backend (RoR, Go) / Data Engineer (Batch, Streaming) / Frontend (React) / SRE / QA

【關於工程團隊】SHOPLINE 台灣研發團隊有超過百位工程師,分為前後端、測試、數據、雲端維運等團隊,台北辦公室採混合辦公模式,目前 Backend、Fron...

鐵人賽 DevOps DAY 30

技術 D31-不同職業的技術面試題-DevOps-SRE工程師(2)

PART 4 面試技巧:展現最好的自己 D31-不同職業的技術面試題-DevOps-SRE工程師(2) 章節目標 快速了解 DevOps-SRE工程師 技術...

鐵人賽 DevOps DAY 30

技術 D30-不同職業的技術面試題-DevOps-SRE工程師(1)

PART 4 面試技巧:展現最好的自己 D30-不同職業的技術面試題-DevOps-SRE工程師(1) 章節目標 快速了解 DevOps-SRE工程師 技術...

鐵人賽 生成式 AI DAY 28

技術 Day28 - 從服務部署到維運:DevOps & 服務監控

前言 在硬體設備、實作部署都告一段落後,最後需要做的就是監控 📊。在部署LLM推理服務後,監控是開發後最重要的其中一部分。這不僅僅是為了服務的穩定性 ⚙️,還能...

鐵人賽 DevOps DAY 9

技術 D9-雲端產業的上中下游

PART 2 知己知彼:先了解產業與公司類型 D9-雲端產業的上中下游 章節目標 快速了解 雲端產業上中下游的關係 及代表企業 雲端產業在全世界蓬勃發展...

鐵人賽 DevOps DAY 8

技術 D8-一群人走得遠,找隊友,找教練,打群架

PART 1 心態建立:我一定能成功 D8-一群人走得遠,找隊友,找教練,打群架 章節目標 換個方式,打群架也可以完成目標 還記得 Computex黃仁...

鐵人賽 DevOps DAY 7

技術 D7-執行計畫,保持好心態,訂立檢核點

PART 1 心態建立:我一定能成功 D7-執行計畫,保持好心態,訂立檢核點 章節目標 了解目標、訂立計畫、定時追蹤、讓你找到 好工作 ! 日本軟體銀行...

鐵人賽 DevOps DAY 5

技術 D5-制定求職計劃(1)

PART 1 心態建立:我一定能成功 D5-制定求職計劃(1) 章節目標 制定屬於自己的 求職計劃 ,邁向理想職缺! 還記得到 烘爐地求籤 的故事嗎?無...

鐵人賽 DevOps DAY 4

技術 D4-從工作角色與年資來制定目標與策略(2)

PART 1 心態建立:我一定能成功 D4-從工作角色與年資來制定目標與策略(2) 章節目標 利用工作角色與年資來執定求職策略 - Senior資深前輩 與...

鐵人賽 DevOps DAY 3

技術 D3-從工作角色與年資來制定目標與策略(1)

PART 1 心態建立:我一定能成功 D3-從工作角色與年資來制定目標與策略(1) 章節目標 利用工作角色與年資來執定求職策略 - Rookie社會新鮮人...

鐵人賽 DevOps DAY 2

技術 D2-心態建立-明確自己的目標

PART 1 心態建立:我一定能成功 D2-心態建立-明確自己的目標 章節目標 求職訂立目標的重要性 中和烘爐地是台灣北部最著名的土地公廟之一,是我常常...

鐵人賽 DevOps DAY 2

技術 【Day 2】認識 DataOps 之前要知道的 DevOps

:DataOps? DevOps? 你們有幾個一起上好了!不用麻煩了!DataOps 和 DevOps:MLOps、AIOps ~走不走~MLOps 和 AI...

鐵人賽 DevOps DAY 1

技術 D1-職涯卡住,怎麼翻轉?Alex的親身經歷與方法

D1-職涯卡住,怎麼翻轉?Alex的親身經歷與方法 本次挑戰目標 這次挑戰只有一個目標:「四步帶你拿到好Offer!」 無論你是希望獲得更高的薪資、更強的工...

鐵人賽 Kubernetes DAY 9

技術 Day 09 -【Basic Concept】:Service

今日目標 Service 的用途 Service 的種類 ClusterIP NodePort LoadBalancer ExternalName...

鐵人賽 Kubernetes DAY 8

技術 Day 08 -【Basic Concept】:Namespace

今日目標 了解 Namespace 的用途 Namespace 的基本操作 建立 Namespace 在特定 Namespace 中進行操作 什...

鐵人賽 Kubernetes DAY 7

技術 Day 07 -【Basic Concept】:Rolling Update & Rollback

今日目標 Deployment 的 Update Strategy Recreate vs Rolling Update Rolling Update 的...

鐵人賽 自我挑戰組 DAY 30
SRE 照書養 系列 第 30

技術 Day 30 - SRE 照書養:錯誤預算的構建與好處

今天是完賽日(歡呼),但是書肯定是要繼續努力看的吧!目標是把第三章讀完!這裡是今天讀的原文出處:Embracing Risk,那我們就開始吧! 書中提到為了做出...

鐵人賽 自我挑戰組 DAY 29
SRE 照書養 系列 第 29

技術 Day 29 - SRE 照書養:使用錯誤預算的目的

安安週五大家好!時光飛逝,一轉眼就快放假了(誒?),這裡是今天讀的原文出處:Embracing Risk,那我們就開始吧! 本書其他章節探討的緊張關係源於產品研...

鐵人賽 自我挑戰組 DAY 28
SRE 照書養 系列 第 28

技術 Day 28 - SRE 照書養:基礎建設服務的風險容忍度(下)

安安週四大家好!沒想到不知不覺就來到第二十八天,有小夥伴問我說會不會繼續把書讀完,是會的喔!這裡是今天讀的原文出處:Embracing Risk,那我們就開始吧...