不管你的角色是SW RD, HW RD, FAE, or MIS,有機器的地方就有問題。從設計上的bug到人為的手殘,又或者是命中注定,百年難得一遇的巧合。Troubleshooting的手法決定了你能多快著眼在問題的核心。這個過程的本質上就是一段推理與解謎,你的對象包含了使用者、3rd party、硬體、軟體和中間無數幫忙傳話的人,要如何揭開其中的矛盾與謬誤呢?且看我分享從事這一行十多年的血淚經驗。
以下我們用穩當當公司(TWSE: 9487)最新出產的伺服器來看一下這個例子。 在一個風和日麗的星期一下午,穩當當公司的工程師們喝著咖啡,一邊聊著今天的股市AI...
實務上其實不只Firmware issue會再回歸,HW issue也是,這裡我們來看個DIMM的例子 人說久病成良醫,就算你不是原廠,不是RD,甚至不是工程師...
有一種客人,有問題來找你時,早晚問候,噓寒問暖。每封信的開頭不忘提及他對你的關心以及你對他的付出,每封信的結尾都是道不盡的感謝與期盼你的回信。 等到他從你身上得...
很多資淺或是剛入行的工程師,常常在看老手處理問題,troubleshooting的速度以及下判斷的精準度令人咋舌。除了那些因為經驗已經遇過的問題可以立馬回答的出...
伺服器與一般的家用主機有幾個顯而易見的差別。 一是價格,二是效能。兩者之間的關聯很好理解,因為效能很好所以價格很昂貴。 但是這樣子的關聯其實有些簡單化了伺服器的...
Troubleshooting這個字,聽起來是個積極的字眼。但是該做到什麼程度你的同事、老板甚至你公司的業務都很難具體給出個明確的定義。因為一但和客人要來認真計...
因為不清楚其他CPU是不是適用以下內容,這裡以I牌CPU為例。 如果你曾經遇過系統死當,Windows的BSOD或是VMware的PSOD,將問題回報廠商後得到...
拿個最近最紅的問題來舉例好了,Intel的第13和14代桌上型CPU的穩定度問題(Vmin Shift Instability issue),目前的發現是CPU...
在伺服器硬體的除錯中,由於BMC晶片的導入,為保留出錯時的資料提供了許多可能性。 不管是CPU的暫存器,BIOS的Port 80或是其他相關的記憶體或是介面卡等...
接續上回的Intel BMC SEL解講,這次從Power繼續說下去。 https://www.intel.com/content/dam/support/us...