iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
DevOps

SRE/K8S 碎碎念 系列

分享一些身為 SRE 在管理 K8S 上踩到的雷跟維運工作

鐵人鍊成 | 共 30 篇文章 | 1 人訂閱 訂閱系列文 RSS系列文
DAY 1

Day 1 開賽及架構介紹

目前負責維運 Private 環境的 EKS 將近一年,趁著這次鐵人賽分享一些維運的鍋跟經驗。Day 1先帶大家了解一下架構。我們會建立一套 EKS,放在 VP...

2023-09-16 ‧ 由 Alvin 分享
DAY 2

[D2] 如何 access 到 private EKS

在架構圖中,我們可以看到因為 EKS 在 private 環境中,我們必須使用相同 VPC 內的 bastion 來操作他。 這邊要先科普一下 EKS 的權限管...

2023-09-17 ‧ 由 Alvin 分享
DAY 3

Day 3 使用 Session Manager 連線至 EKS

假設公司內有多個開發者,我們要讓每個開發者可以進入到跳板機並操作到 EKS,有以下步驟 在 local 端建立金鑰 cd ~/.ssh ssh-keygen...

2023-09-18 ‧ 由 Alvin 分享
DAY 4

D4 維運小工具設定

我們可以用一些簡單的 alias 增加我們維運的效率 這邊我們會預設你有兩種環境 dev 跟 prod,這邊的環境會由你在下指令時選擇,所以我們會有變數的設定(...

2023-09-19 ‧ 由 Alvin 分享
DAY 5

D5 EKS Plugin

今天來分享一個小個案,讓大家知道 K8S 有趣的 plugin 用法 自從將 EKS 從 1.22 升級到 1.24 之後,發生了部署時 helm releas...

2023-09-20 ‧ 由 Alvin 分享
DAY 6

Day 6 PDB, Permission, 跟 Deploy

我們從 K8S 1.23 生到 1.24的時候,有次遇到 deploy 部署失敗,logs 如下 module.eks.aws_eks_node_group.n...

2023-09-21 ‧ 由 Alvin 分享
DAY 7

[2023-07] PDB

K8s 內有一個 controller 叫做 PDB(Pod Disruption Budget),目的是要用来保證 Cluster 中始终有指定的 Pod r...

2023-09-22 ‧ 由 Alvin 分享
DAY 8

[2023-08][Cost Down] 在不必要的時間關閉 Node

這次的任務是為專案省成本,根據 AWS 官方建議,其中之一就是 Down scaling,也就是在閒暇時間將機器關閉。我們專案剛好有 dev,stage,bet...

2023-09-23 ‧ 由 Alvin 分享
DAY 9

[2023-09][Upgrade] 升級 1.25 時的 PSP 與 KSM

維運 EKS 最常遇到的就是每年的更版,尤其這幾年更版速度更是加快,可以看到光2024 就有四個版本要 end of support,改版要注意的事項我們可以在...

2023-09-24 ‧ 由 Alvin 分享
DAY 10

Day 10 升級 1.25 時的 PSP 與cloudwatch-logs-aws-for-fluent-bit

重新整理一下我們升級的判斷順序 確認影響範圍 - PSP deprection 確認使用服務 - aws-cloudwatch-logs-aws-for-fl...

2023-09-25 ‧ 由 Alvin 分享