還真是沒想到複製問題這個在troubleshooting這麼常發生的環節在現在才提到。
不過仔細想了一下,其實經過一段時間的歷練後,不是所有經手的問題都會走到需要親手複製問題的這一步驟。
畢竟著手複製問題時有很多時間與設備的成本在,因此往往是在評估過特別需要或是特別有價值的問題才會走上複雜問題這條路。
此外,如果你是新手的話複製問題也會是個練功的好機會,在條件允許的前提下都是建議去做的。只是要先做好自我懷疑的心理準備,指的是先懷疑自己搞錯再去懷疑客人搞錯,不確定的話就中途問問老手的意見。
畢竟背景知識的深度決定了你複製問題的過程是在快速釐清,還是在製造新的問題。對於老手來說,請新人幫忙複製問題可能還不如自己上比較快,也省下很多排除新手不熟悉該問題的背景而踩坑所浪費掉的時間。
問題急迫性:
不用說,各方人馬找來瘋狂問的情況下,除非你等一下包包收拾下班就要趕去機場了,不然一律先做好複製問題的準備,開始找機器找零件吧,就算是假裝也至少對各方人馬有個交代。
遠端除錯的可行性:
不急的話,再來就要看一下現行的條件,這個就有點取決於問題的現況與你對這個客人的掌握度到那邊了。
我個人的習慣是先了解客人手上目前有沒有能夠配合做調查的機器。
不管客人回報問題時有沒有帶上任何的log,都可以詢問他們是否存在下列的機器。
上述條件存在的話,我會覺得在能最快解決問題的前提之下,請客人配合我們做遠端除錯是能最快達到目的的方式。
要著手進行遠端除錯的話,大致上朝以下的方向進行:
提供指示或是SOP:簡單的cmd或是認真花點時間截截圖,其實通常效果都不錯,而且可以重複使用,CP值高。
提供機器的remote access:通常客人不太會願意,畢竟需要給個什麼帳密或IP讓外內知道,就算是臨時性的大家還是怕怕的,但是滿多客人愛在remote access/live troubleshooting meeting讓你選一個。
live troubleshooting meeting:極力不推薦,就算有什麼客人無法藉由電話/信件清楚表達的問題,我會建議先以傳送影片解釋後,最後才採用這個方式。
可以參考前篇文章的慘痛案例:
https://ithelp.ithome.com.tw/articles/10357463
通常遠端除錯還會再面臨下列問題:
客人忍受度耗盡: 除錯過程來回太多次,客人失去耐心,對於比較重要的客人,以及技術水平比較高的客人,要留意每一次給出的指示以及前後之間相關性,避免過程或是最後除錯發展不順利時被投訴。比較不重要的指示或是問題也盡量減少頻繁發問,以最合理的懷疑先做排除與檢查。
能力/環境無法符合除錯需求: 有時是到場的工程師不具備相關知識,或是現場的環境能配合除錯的能力有限,有時在了解現場人員與環境的能力與狀況後,以這些知識為前提可以準備一個完善的SOP作為輔助來排除,但是也很有可能因為這些因素而導致,無法進行遠端除錯。
其他的環境因素: 有時現場人員是委由第三方公司協助,常規的合約定義中可能只有請他們聽從指示更換零件,甚至此次除錯需要的零件在現場並沒有辦法提供或是更換,因此像這樣的遠端除錯已經超出合約範圍或是窒礙難行。這種情況下,在與相關的各公司討論後,也是可以要求先將機器送至可以遠端除錯的地點(如SI公司的實驗室)再由該地點對應的窗口,進行後續除錯的動作。
客人端已經注意到有問題,但是在自己的實驗室無法複製出來,想找我們協助確認:
這個有點像是客人直接挑明了想讓我們一起複製,面對這種開宗明義的需求,下面有其他的注意事項需要討論。
老板/長官說要做:
這點與上頭雷同,但是就是來自內部的壓力。
R&R(Role & Responsibility)的歸屬問題:
當非做不可時,嘿嘿,我們還可以來討論一下該誰做比較合理。以下是我列出來合理進行複製問題的人員,大家可以視情況把矛頭指向以下人士。
問題複製的注意事項留待下篇說明...