iT邦幫忙

2025 iThome 鐵人賽

DAY 22
1
IT 管理

PM 胃痛圖鑑賞析:30 種專案常見病症與可能或許有效的治療處方系列 第 22

病症21:「怎麼感覺,我們上次好像也有遇過這個問題?」

  • 分享至 

  • xImage
  •  

一個剛上線兩週的新功能,因為不明原因,在每天下午的流量高峰期,都會導致伺服器回應速度驟降,引發大量客訴。

團隊裡的工程師們眉頭深鎖,圍在投影幕前,看著密密麻麻的監控數據。氣氛既緊張又凝重。

突然,團隊裡最資深的工程師阿傑,扶著額頭,用一種充滿既視感的疲憊語氣說:「等等…這個錯誤日誌的模式…我怎麼覺得好像在哪裡看過?我們上次是不是也遇過一模一樣的問題?」

會議室瞬間安靜了下來。大家面面相覷,努力在記憶的深處搜索。

「好像…好像有耶…」另一位工程師附和道,「我記得那時候好像是快取設定的問題?還是資料庫索引…?最後是誰解決的啊?」

沒有人能給出確切的答案。大家只依稀記得,上次為了解決這個問題,整個團隊也熬了好幾個不眠不休的夜晚,但當時的解決方案、踩過的坑、以及最終的根本原因,卻有如南柯一夢般沒有留下任何可追蹤的紀錄。

你看著眼前這群優秀的工程師,因為缺乏歷史紀錄,而被迫在同一塊石頭上,再次痛苦地絆倒一次。你心中不禁浮現一個疑問:為什麼我們的團隊,像一個會失憶的病人,永遠學不會教訓?

症狀診斷

如果你的團隊也常常在同一個地方跌倒,那麼你們正集體罹患一種慢性病:「重複性歷史失誤症」。

這個病症的根源,在於團隊缺乏一個有效的「組織學習機制」。我們常常在撲滅一場大火後,因為急著趕往下一個火場,而忘了回頭去調查並記錄起火的真正原因。

我們把「解決問題」當成了終點,卻忽略了比解決問題更重要的事:從問題中學習,並將學習成果轉化為組織的集體記憶

一個沒有複盤文化的團隊,就像電影《明日邊界》的主角一樣,每天都在同一個戰場上,用同樣的方式陣亡,陷入永無止境的輪迴。每一次的失敗,都只是一次純粹的痛苦,沒有帶來任何成長。

處方籤

第一劑:還原真相,找出病根

這個階段的目標,是產出一份客觀、深入的事件複盤報告。這個流程我們在【病症20】的特別門診中已有詳細探討,步驟基本上是類似的,你該做的步驟依然不變:透過一對一訪談系統紀錄拼湊出客觀的事件時間軸。然後,召開一場小規模的、無責備文化的複盤會議,帶領團隊用「5個為什麼」找出真正的系統性漏洞,並產出包含具體行動、負責人、完成時限的改善清單。

第二劑:建立團隊的「微型黑盒子」,無痛典藏失敗

一份再完美的報告,如果流程過於繁瑣,就注定會被束之高閣,所以我們需要從一個阻力最小的開始,這樣才有機會繼續維持,而更有機會推進團隊進到下一步。

  • 最低阻力選項 A:從 Commit Message 開始
    與其一開始就導入複雜的文件系統,不如從團隊每天都在使用的工具著手。要求工程師在修復重大 Bug 的 Commit Message 中,除了描述程式碼的修改,多加一行註解,簡述「根本原因」與「解決思路」。這是成本最低、最容易被接受的起點。
  • 整合性佳選項 B:活用 Jira Ticket
    在複盤會議後,自建立一張類型為「學習檔案 (Learning)」的 Jira Ticket。在這張票的描述欄中,用條列式寫下事件摘要、根本原因和行動項目,並將它與當初的 Bug Ticket 互相連結。這樣未來在搜尋相關功能時,就能一併看到這次的學習紀錄。
  • 長期目標選項 C:建立專屬知識庫
    當團隊習慣了記錄與分享後,再考慮在 Confluence 或 Notion 上建立一個名為「專案黑盒子」的專屬空間(名字當然就是看你跟團隊的共識與創意啦),將這些 Jira Ticket 的內容,定期整理歸檔。

第三劑:將「教訓」植入至團隊的慣性

明確且可處理的條列項目,就應該直接融入現有的流程中。除了紀錄之外,最重要的是將這些學到的教訓轉化為具體的流程調整,確保團隊不會在未來重蹈覆轍。

  • 更新「檢查清單」:如果這次的問題是因爲沒有考慮到某種邊界條件,那就立刻把「確認 X 邊界條件」加入到未來所有新專案的檢查清單中。
  • 優化「DoD 」:如果問題是因爲測試覆蓋率不足,那就和團隊討論,是否該將「壓力測試」或「特定場景的整合測試」納入 DoD。
  • 建立新的「SOP 或文件模板」:如果問題是因爲某個流程缺乏規範,那就藉此機會,建立一份標準作業流程。

臨床實戰

好,鏡頭切換回開頭那個充滿既視感的會議室。

當阿傑說出那句「我們上次好像也有遇過這個問題」時,你接下來該如何應對?

  1. 抓住切入點
    千萬不要讓這個寶貴的機會瞬間溜走。你可以立刻說:「阿傑,這是一個非常重要的發現!大家能幫忙花五分鐘,找一下上次專案的相關紀錄嗎?不論是 Jira Ticket、會議記錄或 Slack 對話都可以。」
  2. 把握改變的契機
    五分鐘後,如你所料,沒有人找到任何有價值的紀錄。打鐵要趁熱,此刻正是最佳時機,因為團隊正感受到痛點,更願意接受改變。你可以接著對團隊說:「如果連我們自己都找不到上次的解決方案,下次肯定還會遇到同樣問題。既然我們都會開任務票,何不在上面記錄簡單摘要呢?」

有了團隊共識後,未來跌入新的坑洞時,這些經驗將不再只是單純的痛苦記憶,而是可以轉化為團隊寶貴的集體智慧!

最後的醫囑

一個團隊的強大,不在於它從不犯錯,而在於它從不重複犯錯。

每一次的線上事故、每一次的專案延誤、每一次的客戶抱怨,不只是一個需要被解決的問題,更是一次極其寶貴的學習機會。它們是專案路上的「警示燈」,用真實案例點出系統中最脆弱的環節。

你的價值不僅在於帶領團隊完成一台台成功的手術,更在於你能否在手術結束後,帶領團隊召開病例研討會,解剖失敗的案例,將寶貴的教訓寫入醫療紀錄,並更新手術流程,確保下一次面對同樣的病患時,我們能下刀更準。


每次失憶我都先懷疑我跟威爾史密斯見過面
https://ithelp.ithome.com.tw/upload/images/20250901/201457904J4cEHwSPy.jpg
大腦的記憶真的很不可靠!!!


上一篇
病症20:「完了!線上服務掛了!!!」
下一篇
病症22:「工程師說的是中文嗎?」
系列文
PM 胃痛圖鑑賞析:30 種專案常見病症與可能或許有效的治療處方24
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言