iT邦幫忙

sre相關文章
共有 87 則文章

徵才 【徵才/台北/部分遠端】富果帳戶-Site Reliability Engineer

關於富果 富果帳戶,是年輕人都在用的投資帳戶! 在富果的每一位夥伴都相信著,透過持續學習和進步,投資這項技能將成為我們這個世代,累積財富的一種理想方式。所以我們...

徵才 [台北] Senior Backend Developer

新場景股份有限公司為台灣第一家以網路垂直領域意見領袖(a.k.a 網紅)作為標籤的快銷品公司,公司成立於 2019 年,為新媒體網紅解決方案提供方 PressP...

徵才 [新北中和] 徵 Site Reliability Engineer (SRE) *3

工作內容:1.從無到有打造自動化流程、實現 Google SRE 的成就 需求條件:1.有SRE: GCP (Google Cloud Platform), K...

鐵人賽 IT管理 DAY 13

技術 Day 13 運算寶石:【Lab】EC2儲存資源 EBS Volume 建立與使用 (下)

今天,我們繼續【Lab】EC2儲存資源 EBS Volume 建立與使用下半部分。 連進 EC2 Instance 設定 EBS Volume 使用 再來回到...

徵才 阿物股份有限公司 徵才:Site Reliability Engineering 工程師 (台北)

工作內容【在 awoo 的 SRE 目標?】在 awoo,不再是以過去的 MIS思維來從事 IT 相關的業務。在創新的思維下,我們擁抱改變,並在變化與 穩定中取...

鐵人賽 DevOps DAY 1

達標好文 技術 前言 & 基本監控系統

(寫在獲獎後) 逐家好,Ta̍k-ke hó。 原本是抱持著單純參賽與記錄工作經驗的心情來撰寫文章的,沒想到非常幸運地獲得評審的青睞,能獲得這次的冠軍。誠如原文...

技術 Docker圖解教學 - 什麼是Docker?

影片連結:https://hahow.in/cr/docker-picture 架構圖:https://imgur.com/N3s6qsU 這邊跟大家分享,正式...

技術 教學-Docker-基本架構概念教學

Youtube連結:https://bit.ly/3butDlV 本影片將透過3D圖示介紹Docker跨平台的特型與原理! 本次要探討的架構圖如下:

鐵人賽 DevOps DAY 3
Dev's Ops 啟程 系列 第 3

技術 [Day 3] SRE - Log寫好一點,對團隊好一些

LogSeverity 有在寫Log的人都知道Log需要被分級,而分級對於問題的除錯,是很重要的,當問題發生時可以幫助工程師快速定位。 相信在寫go的人都對lo...

技術 教學-Docker-如何在不同作業系統上使用 觀念解說

Youtube連結:https://bit.ly/3fHjZzv Docker 能運行在各個不同的作業系統上,然而對於各種作業系統,我們需要相對應的安裝方...

技術 教學-如何建立與使用Docker image

Youtube連結:https://bit.ly/2Wt5pE9 此影片中,我們將比較「一般佈版」與「Docker 佈版」兩者的差異,透過實際操作讓大家體...

鐵人賽 DevOps DAY 1

技術 Day 1 - 需不需要 Kubernetes,這是個好問題XD,從需求量化分析,根據數據做科學決策

本文同步刊登於個人技術部落格,有興趣關注更多 Kubernetes、DevOps 相關資源的讀者,請務必追蹤從零開始的軟體工程師之旅,喜歡的話幫我按讚分享、歡迎...

鐵人賽 DevOps DAY 3

技術 特別監控系統1: 第三方服務監控,第一波調整

之前的文章有提到了基本的監控系統,接下來會是介紹為了專案各自的狀況而建立的特別監控系統。 背景故事 首先是監控客戶系統的部分,背景故事其實相當單純。我們的系統在...

鐵人賽 DevOps DAY 2

技術 系統警報概論

在上一篇文章中介紹了基本的監控系統,並簡單帶到在發生警報時值班工程師的必須要做到的行動。這篇文章主要會介紹比較詳細的警報SOP,以及設置警報時的各種考量。 警報...

鐵人賽 DevOps DAY 4
Dev's Ops 啟程 系列 第 4

技術 [Day 4] SRE - 保持精簡的監控

監控 今天來介紹監控的四個黃金訊號、如何簡化以及如何維護。 四個黃金訊號 延遲 流量 錯誤 飽和度 延遲 請求的結果分兩種成功的請求與失敗的請求「慢」的錯比...

鐵人賽 DevOps DAY 14
Dev's Ops 啟程 系列 第 14

技術 [Day 14] 關於 SRE 與 SEC 的關係

關於SEC的事情 資料庫演練100%備份還原 每年至少兩次的資料災害恢復演練,資料要100%覆蓋,要100%可恢復!可以由資深同仁帶著比較沒經驗的同仁,順便幫助...

鐵人賽 DevOps DAY 10
Dev's Ops 啟程 系列 第 10

技術 [Day 10] SRE - ON-CALL

ON-CALL 今天為大家介紹ON-CALL常見的須注意之事項 建立心態 我為人人,人人為我,今天你幫大家解決問題,大家之後也會在你不便之時幫助你,以我們te...

鐵人賽 DevOps DAY 13
Dev's Ops 啟程 系列 第 13

技術 [Day 13] SRE - 悟

關於身為SRE團隊的心得 關於SRE的系列終於分享完囉~所以講一下SRE從零星到有概念後的心得,以下是關於團隊,個人覺得關於系統的維運面的心得 成員信心提高 大...

鐵人賽 DevOps DAY 5
Dev's Ops 啟程 系列 第 5

技術 [Day 5] SRE - 發動測試左移之術,預視未來的機制

測試左移(Shift Left Testing ) 如何事件左移 事先演練未來排定作業 因為團隊會在每週固定時間進行週會,而這個技巧我常常會在週會後,看著未來的...

鐵人賽 DevOps DAY 2
Dev's Ops 啟程 系列 第 2

技術 [Day 2] SRE - 你的服務死後不要讓人擔心嘛

graceful shutdown 在關閉服務前,在服務內部以做完該做的事情,使得服務得以善終。在容器化的時代,現在的部署更新,幾乎都是透過image版本更新的...

鐵人賽 DevOps DAY 5

技術 特別監控系統2: 資料庫異常登入監控

前言 上篇文章已經介紹了一個客製化的特別監控系統,這篇文章則會是另外一個,希望能夠藉由這2個系統,讓大家可能理解SRE是為了什麼而做監控。 這個監控系統主要是為...

鐵人賽 DevOps DAY 1
Dev's Ops 啟程 系列 第 1

技術 [Day 1] Dev's Ops 啟程前言

啟程 哈囉 各位Ithome的大家,今年的鐵人賽又見面拉~今年要來跟大家分享在當個純Dev後,因工作分配接下來當也要負責Ops,當中的轉變的經驗,還有在我職涯經...

鐵人賽 DevOps DAY 4

技術 特別監控系統1: 第三方服務監控,第二波調整

背景 前一篇文章提到了第一波針對 APIGW 的監控修正,但因為最後發現的各種問題,導致我們要進行第二波針對這個監控的修正。 主要是,在某一次緊急的 P0 事件...

鐵人賽 DevOps DAY 11
Dev's Ops 啟程 系列 第 11

技術 [Day 11] SRE - 事後檢討,拜託拜託讓我吸個經驗值

從歷史中學習 我們最討厭事件歷史重演QQ在每次遇到問題後,我們全員都會一起開個檢討會議,當中會提到問題發生的根源,是否會再發生?是否能自動化?是否有介面 or...

徵才 【徵才】Zyxel_Site Reliability Engineer

上班地點可選新店或新竹, 彈性上下班時間, 開放的辦公環境與文化;與一流高手切磋技術, 與全球人才互動交流, 高效投資個人未來發展 Responsibiliti...

鐵人賽 DevOps DAY 6
Dev's Ops 啟程 系列 第 6

技術 [Day 6] SRE - 起身對抗活在警報中的惡魔

警報疲乏 相信大家都聽過「放羊的孩子」的伊索寓言故事。 今天我們探討的問題是當團隊中的警報器常常發生不是「真正的警報」而是「假警報」時,會導致大家對於警報的警覺...

鐵人賽 DevOps DAY 9
Dev's Ops 啟程 系列 第 9

技術 [Day 9] SRE - 自動化

自動化 什麼東西可以自動化?對我而言只要可以列出SOP的事情,都可以實現自動化。 價值 一致性 當不同人遇到同樣的事件,處理的方法可能有百百種,但不一定每個人處...

鐵人賽 DevOps DAY 30

技術 Day 30 完賽宣言 - 下一步該如何走?

本篇大綱 這篇來總結這 30 天學了哪些東西,要怎麼繼續學習 IT/SRE 的相關知識,還有完賽心得。 內文 終於 Day 30 啦!這篇來回顧一下學習了哪些東...

鐵人賽 DevOps DAY 8
Dev's Ops 啟程 系列 第 8

技術 [Day 8] SRE - 火炎焱燚之保衛戰

火燒起來怎麼辦? 當你聽到手機有叮咚叮咚,一連串的alert表示服務已無法繼續服務,幾分鐘後電話來了,通報案件後,你該如何是好? 先保持冷靜 保持冷靜,避免過...

鐵人賽 DevOps DAY 12
Dev's Ops 啟程 系列 第 12

技術 [Day 12] SRE - 定期演練計畫

災害模擬演練 今天跟各位分享一下,我們團隊從零開始的定期演練流程。 事前準備 先開個google試算表,與團隊成員共享。開個「模擬事件List」分頁,然後貼到群...