问题描述
现场有三台2288H V5需安装操作系统,用KVM挂载系统镜像,重启后选择启动项,按F11或DEL后均卡在当前界面无反应,三台的问题现象一模一样
告警信息
按F11或DEL均卡在当前界面如下:
处理过程
1. 确认服务器无硬件告警
2. 尝试更换系统镜像后,KVM挂载系统镜像安装操作系统,问题依旧
3. 不挂载系统镜像,让服务器开机运行下去,服务器正常走到未安装操作系统时应该走到的界面
4. 不挂载系统镜像,服务器开机阶段按F11,输入BIOS密码后黑屏无反应,开机阶段按DEL,输入BIOS密码后可以进入BIOS界面,当选择进入启动项界面后黑屏无反应
5. 尝试使用Smart Provisioning引导安装操作系统,挂载系统镜像重启后,问题依旧
6. 做最小化测试,只留电源,主板,单CPU,单内存运行,逐步增加部件,最后发现一旦插上HBA卡,就会出现卡界面的问题
7. 收集BMC日志以及HBA卡信息,确认有无兼容性问题,经过确认兼容性无问题
8. 用现场相同配置的无问题的服务器做交叉测试,有问题的服务器更换上无问题的服务器的HBA卡后,挂载系统镜,开机阶段不管是按F11和DEL都能正常进入下一级界面。而无问题的服务器更换上有问题的服务器的HBA卡后,挂载系统镜像,开机阶段按F11或DEL均卡在当前界面无反应。
9. 现场另外两台有同样问题的服务器做过上述测试后,测试结果与第一台服务器一致
10. 追加HBA卡,现场更换后,问题解决
根因
HBA卡故障
解决方案
更换HBA卡
建议与总结
在遇到无硬件告警的场景时,建议使用最小化测试可以比较准确的定位问题。
发表评论