Linux系統(tǒng)死機的軟硬件問題分析
引用
KLOGD_OPTIONS=-x -c 7
重啟服務(wù)器;進行測試:
1)使用串口直連線連接客戶機和服務(wù)器,在客戶機上運行:
cat /dev/ttyS0
服務(wù)器上運行:
echo hi > /dev/ttyS0
如果客戶機有hi輸出即可。
2)服務(wù)器上運行:
echo w > /proc/sysrq-trigger
看看客戶機上是否有相應(yīng)的內(nèi)核信息輸出
3)服務(wù)器上運行:
modprobe loop
看看客戶機上是否有相應(yīng)的內(nèi)核信息輸出
如果測試都通過的話,那么在客戶機上運行:
cat /dev/ttyS0 | tee /tmp/result
當(dāng)死機出現(xiàn)的時候,我們就可以從客戶機上看到需要的內(nèi)核信息了(查看/tmp/result)。
三、總結(jié)
系統(tǒng)硬件問題(SCSI卡,主板,RAID卡,HBA卡,網(wǎng)卡,硬盤等)
外圍硬件問題(網(wǎng)絡(luò)等)
驅(qū)動bug(找新的驅(qū)動)
核心系統(tǒng)bug(到LKML看看,或更換核心再試)
系統(tǒng)設(shè)置(恢復(fù)到缺省狀態(tài),關(guān)閉防火墻等)
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)
評論