在前面的二集著重於探討系統本身的問題,其實非系統本身的問題也不少,今天在下集就要大家談談這屬於第二類:非系統的本身額外加裝的軟體問題,我們該如何檢測和分析.
首先,來複習一下,在AIX上的軟體可大致歸為二類: 系統本身的與非系統的本身額外加裝的.
1.系統本身的: 請參閱AIX - 軟體的問題檢測與分析 上集
2.非系統本身的: 例如 Oracle ,SAP , ERP ...等等, 這些不屬於AIX 本身的軟體,在這裡外來加裝都視為非系統本身的軟體,二家不同公司開發的軟體,不可能一開始就100%完全相容,當彼此內有程序不合, bug就出現了,在這個時候core dump 就產生了, 而在此, 我建議幾個的處理步驟,供大家參考如下:
1.收集core dump的資料 : 你可以透過AIX指令” snap ”來收集core dump 資料的內容,至於怎麼使用,建議您參考IBM網站的介紹 snap命令的語法
2.檢查error log : 這個我在前面有教過大家囉, 所以請參考AIX-基本的錯誤偵測與報告 Part I,通常你可以留意Label 會寫著CORE_DUMP
3.檢查system Status
4.檢查 Network Status
5.檢查 File system
6.分析 core dump的內容 : 你可以藉用AIX提供的工具” dbx “來分析調校core dump , 關於dbx使用 , 可參考官方網站使用dbx
當然這樣的資料收集和分析,初步也只能在找出問題的癥結,最好的方法也希望軟體廠商的開發人員也能一起配合協同找出問題的所在,才能儘快修正,讓系統恢復運作.