华为服务器2288H V5用KVM挂载系统镜像,开机阶段按F11或DEL后均卡在当前界面无反应

问题描述

现场有三台2288H V5需安装操作系统,用KVM挂载系统镜像,重启后选择启动项,按F11或DEL后均卡在当前界面无反应,三台的问题现象一模一样

告警信息

按F11或DEL均卡在当前界面如下:

处理过程

1.  确认服务器无硬件告警

2.  尝试更换系统镜像后,KVM挂载系统镜像安装操作系统,问题依旧

3.  不挂载系统镜像,让服务器开机运行下去,服务器正常走到未安装操作系统时应该走到的界面

4.  不挂载系统镜像,服务器开机阶段按F11,输入BIOS密码后黑屏无反应,开机阶段按DEL,输入BIOS密码后可以进入BIOS界面,当选择进入启动项界面后黑屏无反应

5.  尝试使用Smart Provisioning引导安装操作系统,挂载系统镜像重启后,问题依旧

6.  做最小化测试,只留电源,主板,单CPU,单内存运行,逐步增加部件,最后发现一旦插上HBA卡,就会出现卡界面的问题

7.  收集BMC日志以及HBA卡信息,确认有无兼容性问题,经过确认兼容性无问题

8.  用现场相同配置的无问题的服务器做交叉测试,有问题的服务器更换上无问题的服务器的HBA卡后,挂载系统镜,开机阶段不管是按F11和DEL都能正常进入下一级界面。而无问题的服务器更换上有问题的服务器的HBA卡后,挂载系统镜像,开机阶段按F11或DEL均卡在当前界面无反应。

9.  现场另外两台有同样问题的服务器做过上述测试后,测试结果与第一台服务器一致

10. 追加HBA卡,现场更换后,问题解决

根因

HBA卡故障

解决方案

更换HBA卡

建议与总结

在遇到无硬件告警的场景时,建议使用最小化测试可以比较准确的定位问题。