iT邦幫忙

sre相關文章
共有 115 則文章

技術 [SRE×AI #07] SRE 的 Prompt 工程:怎麼讓 AI 按照你的方式調查

AI 很聰明。但它不知道你們的 log 要去哪裡查、哪個 index 對應哪個服務、收到 503 要先看什麼。 AI 很聰明,但它不認識你的系統 前幾篇...

鐵人賽 DevOps DAY 1

技術 D1-職涯卡住,怎麼翻轉?Alex的親身經歷與方法

D1-職涯卡住,怎麼翻轉?Alex的親身經歷與方法 本次挑戰目標 這次挑戰只有一個目標:「四步帶你拿到好Offer!」 無論你是希望獲得更高的薪資、更強的工...

鐵人賽 DevOps DAY 24

技術 重要事件1:ISO 27001,簡介與改善項目

前言 SRE 日常的事務是保持系統的穩定,因此會有許多日常維運,以及處理重要事件時相關的工作。前面提到的工作大多沒有結束的日期,是屬於會重複發生或要持續改進的工...

鐵人賽 DevOps DAY 14

技術 日常維運3: 註冊 OpsWorks 失敗,挑戰與心得

前言 前面介紹完了註冊 OpsWorks 失敗的解決方案。這篇文章想分享一些在處理過程中值得分享的事情。 Userdata 的挑戰 shell script 第...

鐵人賽 Kubernetes DAY 8

技術 Day 08 -【Basic Concept】:Namespace

今日目標 了解 Namespace 的用途 Namespace 的基本操作 建立 Namespace 在特定 Namespace 中進行操作 什...

鐵人賽 DevOps DAY 3

技術 D3-從工作角色與年資來制定目標與策略(1)

PART 1 心態建立:我一定能成功 D3-從工作角色與年資來制定目標與策略(1) 章節目標 利用工作角色與年資來執定求職策略 - Rookie社會新鮮人...

鐵人賽 自我挑戰組 DAY 6
SRE 照書養 系列 第 6

技術 Day 6 - SRE 照書養:緊急事件處理

大家週三好,嗚嗚這週要上六天班好漫長,今天我們要繼續 SRE 方法論的第四條:緊急事件處理,這裡是今天讀的原文出處:Introduction,話不多說,我們開始...

鐵人賽 DevOps DAY 20

技術 重大P0事件簿3: 來自 TD-Agent 的挑戰,資源調配的難題

前言 這個 P0 事件是在筆者參賽鐵人賽時發生的,而發生事件的當下,筆者正準備想要趕一下鐵人賽進度^^ 事件經過 警報與初步處置 這個事件本身與上一篇文章中提到...

鐵人賽 DevOps DAY 2

技術 【Day 2】認識 DataOps 之前要知道的 DevOps

:DataOps? DevOps? 你們有幾個一起上好了!不用麻煩了!DataOps 和 DevOps:MLOps、AIOps ~走不走~MLOps 和 AI...

鐵人賽 DevOps DAY 5

技術 D5-制定求職計劃(1)

PART 1 心態建立:我一定能成功 D5-制定求職計劃(1) 章節目標 制定屬於自己的 求職計劃 ,邁向理想職缺! 還記得到 烘爐地求籤 的故事嗎?無...

鐵人賽 DevOps DAY 18

技術 重大P0事件簿1: 倒站又不倒站,處理流程與技術心得

前言 上一篇談到了這次 P0 事件中的警報過程,以及具體的事件成因。在這一篇中,就要介紹接下來的一連串處理流程,以及在整個流程中筆者自己有學到,也認為值得分享的...

鐵人賽 DevOps DAY 25

技術 重要事件1:ISO 27001,其它定期事務、挑戰與心態

前言 上一篇文章介紹了 ISO 27001 這個工作本身, 以及透過一個實際的改善項目來讓大家了解整個過程。 每次稽核過後,都會出現一連串的改善事項,在要求的時...

鐵人賽 DevOps DAY 12

技術 日常維運3: 註冊OpsWorks失敗,事件與架構

前言 介紹了兩個日常維運的系列之後,接下來想分享給各位的,是與部署工具相關的維運。SRE 和 DevOps 有時候相當難區分的地方就在於,維運本身有許多工作難以...

鐵人賽 DevOps DAY 27

技術 重要事件2:CDN Migration,技術挑戰與心得分享

前言 在上一篇文章中介紹了目前 CDN 搬遷的過程,以及在過程中遇到的問題與挑戰。這篇文章會針對技術上學習到的東西來再與各位進行下一步的分享。 主文 Multi...

鐵人賽 DevOps DAY 22

技術 重大P0事件簿4: API 異常連線攀升,成因與後續處置

前言 上一篇介紹了 API 伺服器異常連線攀升的事件中,一些初步的調查和分析。同時也否定了最初的猜測,但也得到了另一個切入點。 在這一篇中,我們將從個切入點出現...

鐵人賽 DevOps DAY 29

技術 重要事件4:OpsWorks EOL 與容器化,當國本被動搖時

前言 OpsWorks 被 AWS 宣告要 EOL,跟據筆者主管非常精闢的描述,就是「動搖國本」。因為敝公司幾個最大最古老的專案,也就是採用 EC2 解決方案的...

鐵人賽 自我挑戰組 DAY 12
SRE 照書養 系列 第 12

技術 Day 12 - SRE 照書養:Borg 淺聊(上)

嗨!週二大家好!今天是 DevOpsDay 的第二天,滿滿兩天的議程收穫豐富!回家後繼續看書寫文章拉!這裡是今天讀的原文出處:The Production En...

鐵人賽 自我挑戰組 DAY 2
SRE 照書養 系列 第 2

技術 Day 2 - SRE 照書養:Dev & Ops

沒想到一開賽就遇到週末,週末最適合配著書,喝個下午茶拉!那麼今天先來了解一下傳統開發部門跟維運部門,以及 SRE 的前世今生吧!這裡是今天讀的原文出處:Intr...

鐵人賽 DevOps DAY 23

技術 警報的改善,滾動式的進步永動機

前言 在經過一連串的嚴重 P0 事件簿後,不知道讀者對處理相關事件是否更有概念了呢?在「系統警報概論」這篇文中曾有初步提到過,因為 P0 事件的當下資訊非常多且...

鐵人賽 自我挑戰組 DAY 1
SRE 照書養 系列 第 1

技術 Day 1 - SRE 照書養:一切地開始是那麼突然

距離上次參加鐵人賽竟然已經過了三年!上次是寫跟專案管理有關的內容,這次竟然要挑戰 SRE 的系列文章?!「小姐,你是不是也太跳 Tone」 XD,沒錯!我就是一...

鐵人賽 DevOps DAY 2

技術 D2-心態建立-明確自己的目標

PART 1 心態建立:我一定能成功 D2-心態建立-明確自己的目標 章節目標 求職訂立目標的重要性 中和烘爐地是台灣北部最著名的土地公廟之一,是我常常...

鐵人賽 自我挑戰組 DAY 11
SRE 照書養 系列 第 11

技術 Day 11 - SRE 照書養:Google 數據中心

嗨!週一大家好!今天請公假去 DevOpsDay 進修!回來再繼續看書寫文章拉!第二章先從 Google 數據中心的設備開始說起,這裡是今天讀的原文出處:The...

鐵人賽 DevOps DAY 13

技術 日常維運3: 註冊OpsWorks失敗,UserData與LifeCycle Hooks

前言 前一篇提到了 userdata 中透過 AWS CLI 來下達註冊 OpsWorks 的指令,會有失敗的可能性。這篇主要會來分享實驗過程與解決方式。 主文...

鐵人賽 自我挑戰組 DAY 24
SRE 照書養 系列 第 24

技術 Day 24 - SRE 照書養:如何計算服務的風險?

安安!國慶連假第二天!今天進到第三章囉!這裡是今天讀的原文出處:Embracing Risk,那我們就開始吧! 書中提到 Google 將優化系統的目標化為客觀...

鐵人賽 自我挑戰組 DAY 30
SRE 照書養 系列 第 30

技術 Day 30 - SRE 照書養:錯誤預算的構建與好處

今天是完賽日(歡呼),但是書肯定是要繼續努力看的吧!目標是把第三章讀完!這裡是今天讀的原文出處:Embracing Risk,那我們就開始吧! 書中提到為了做出...

鐵人賽 自我挑戰組 DAY 18
SRE 照書養 系列 第 18

技術 Day 18 - SRE 照書養:Borg 的軟體基礎設施

安安!大家週一好!今天來看 Borg 的軟體基礎設施!這裡是今天讀的原文出處:The Production Environment at Google, fro...

鐵人賽 自我挑戰組 DAY 28
SRE 照書養 系列 第 28

技術 Day 28 - SRE 照書養:基礎建設服務的風險容忍度(下)

安安週四大家好!沒想到不知不覺就來到第二十八天,有小夥伴問我說會不會繼續把書讀完,是會的喔!這裡是今天讀的原文出處:Embracing Risk,那我們就開始吧...

鐵人賽 自我挑戰組 DAY 17
SRE 照書養 系列 第 17

技術 Day 17 - SRE 照書養:Borg 的其他軟體系統

今天是中秋連假的最後一天!收拾心情明天準備上班拉!這裡是今天讀的原文出處:The Production Environment at Google, from...

鐵人賽 DevOps DAY 28

技術 重要事件3:資料庫搬家,在文件上灑一點辛香料

前言 如同之前的所有系列一樣,重要事件也有大事件和小事件。而這篇文章將分享一篇小事件,也就是資料庫搬家的工作。 背景 背景故事是,我們的資料庫使用了某一個即將要...

鐵人賽 自我挑戰組 DAY 15
SRE 照書養 系列 第 15

技術 Day 15 - SRE 照書養:Borg 存儲系統

不知不覺賽程就一半了!這裡是今天讀的原文出處:The Production Environment at Google, from the Viewpoint...