iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
DevOps

SRE/K8S 碎碎念 系列

分享一些身為 SRE 在管理 K8S 上踩到的雷跟維運工作

鐵人鍊成 | 共 30 篇文章 | 1 人訂閱 訂閱系列文 RSS系列文
DAY 11

[D11][Upgrade] EndpointSlice

今天針對1.25升級剩下的項目做個總結 EndpointSlice 的 API beta 要淘汰掉(discovery.k8s.io/v1beta1) The...

2023-09-26 ‧ 由 嗷嗷嗷 分享
DAY 12

[D12] Appmesh and envoy

某次 release 之後,我們有一隻 client api 發出了 TargetResponseTime >= 1.5 跟 HTTPCode_Targ...

2023-09-27 ‧ 由 嗷嗷嗷 分享
DAY 13

D13 appmesh-controller

在我們的架構中,有一隻 Cronjob 會產出 report,像是 Payment, Member info 等,某天他突然掛掉,導致 report 沒有正常產...

2023-09-28 ‧ 由 嗷嗷嗷 分享
DAY 14

D14 EC2 Instance Connect Private Endpoint

之前有提到我們將連線 EKS 的方式改成 Jump 機 + SSM,從此開啟一條比喝玫瑰花茶還要順暢的連線道路。但我們有沒有辦法連 jump 機都不要了呢? 先...

2023-09-29 ‧ 由 嗷嗷嗷 分享
DAY 15

D15 monitor metrics

剛好在 2023 DevOps Day 聽到 Blueswen 在國泰的可觀測性實踐,是一場很啟發且淺顯易懂的演講。於是決定接下來幾個章節以現有 Monitor...

2023-09-30 ‧ 由 嗷嗷嗷 分享
DAY 16

D16 logs

EKS 內最上層的 logs 首要就是 control plane logging, API server (api)跟 API 相關設定 審計日誌 (...

2023-10-01 ‧ 由 嗷嗷嗷 分享
DAY 17

D17 logs fluent bit

先來介紹 logs 收集的 ELK,EFK。額外還有 Filebeat,Loki,有空再額外多做說明 ELK 架構傳統架構上比較成熟的 log 收集為 ELK(...

2023-10-02 ‧ 由 嗷嗷嗷 分享
DAY 18

D18 Traces

Amazon EKS 中,trace 功能用於收集和分析微服務應用程式的運行時資訊。追踪可以幫助您識別性能瓶頸、解決錯誤以及優化應用程式。以下是一些建議的方法來...

2023-10-03 ‧ 由 嗷嗷嗷 分享
DAY 19

D19 Maintenance mode

今天來討論 maintenance mode 的實踐,我們 maintenance mode 基本的概念是調整 ALB 的 rule。並將他轉導到 503 re...

2023-10-04 ‧ 由 嗷嗷嗷 分享
DAY 20

D20

為了從 ingress 的設定下手,我們將更動從 ALB 改成 ingress,方法就是使用變數的設定來做切換。首先,我們先定義不同的 rule 對應到的 ta...

2023-10-05 ‧ 由 嗷嗷嗷 分享