什麼東西可以自動化?對我而言只要可以列出SOP的事情,都可以實現自動化。
當不同人遇到同樣的事件,處理的方法可能有百百種,但不一定每個人處理的SOP都是最佳化的,而你們可以討論出最佳化的流程並套用到自動化程式上,讓每個人處理此問題都保有一致性。
平台性可以將錯誤批量修正,如果你有1000台機器你只能一台一台修正的話,那要修到何時?而有平台性的自動化可以瞬間完成,反覆性的處理工作。
如果按照SOP,一步一步慢慢修正問題的話,「人」就可能造成失誤,而「人」的處理速度一定不會比自動化的SOP腳本還快,反之能利用自動化來自動處理,並預防問題發生。
當call你上線到真正上線處理完問題最快最快可能要3分鐘,但只需要自動化的功能或程式需要的時間絕對比你還要快。因此自動化可以幫助消除那些routine job。
在SRE的世界,盡量避免手動操作,但免不了有些事情還是需要手動。
在寫完自動化程式的後續維護流程
只要能制定出SOP標準的流程,基本上都能寫成自動化腳本。