简介
本文档介绍如何对Cisco UCS环境中的RAID控制器问题进行故障排除、收集日志和建议所需的操作。
先决条件
要求
本文档没有任何特定的要求。
使用的组件
本文档中的信息基于以下软件和硬件版本:
- 统一计算系统(UCS)
- 思科统一计算系统管理器(UCSM)
- 独立磁盘冗余阵列(RAID)控制器
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解所有命令的潜在影响。
已知UCSM故障代码
UCSM故障:F1004
说明:服务器X上的控制器X无法运行。原因:设备无响应。
UCSM故障:F1004
说明:服务器2上的控制器1无法运行。原因:设备报告损坏的数据。
UCSM故障:F1007
说明:服务器X上的虚拟驱动器X可操作性:不可操作。原因:驱动器状态:未知。
UCSM故障:F0181
说明:服务器3/4上的本地磁盘1可操作性:不可操作。原因:驱动器状态:未知。
UCSM故障:F1834
说明:服务器2/7上的控制器1已降级。原因:controller-flash-is-degraded。
更换RAID控制器
更换RAID控制器时,存储在控制器中的RAID配置会丢失。使用此过程将RAID配置恢复到新的RAID控制器。
传统模式
步骤1:关闭服务器电源,更换RAID控制器。
警告:如果是全机箱更换,请将所有驱动器按照安装在旧机箱中的相同顺序更换到驱动器槽位。从当前机箱中移除驱动器之前,请标记每个磁盘顺序。
第二步:重新启动服务器,并观察提示按F。
当您看到此屏幕提示时,按F。
Foreign configuration(s) found on adapter.
Press any key to continue or 'C' load the configuration utility, or 'F' to import foreign configuration(s)
注:在更换RAID控制器之前,VD可以是从主机访问的最佳方法。
UEFI引导模式
步骤1: 检查服务器是否配置为统一可扩展固件接口(UEFI)模式。
第二步:关闭服务器电源,更换RAID控制器。
警告:如果是全机箱更换,请将所有驱动器按照安装在旧机箱中的相同顺序更换到驱动器槽位。从当前机箱中移除驱动器之前,请标记每个磁盘顺序。
第三步:重新启动服务器并注意F2提示。
第四步:当系统提示输入BIOS设置实用程序时,按F2。
第五步:在Setup Utility下,导航到Advanced > Select controller > Configure,然后单击Import foreign configuration to Import。
注:在更换RAID控制器之前,VD可以是从主机访问的最佳方法。
要收集的日志
请确保将这些日志附加到TAC案例。
- 服务器技术支持(_T)
- UCSM_techsupport(如果适用)
- 操作系统日志和驱动程序详细信息
- LSIget/storcli日志
- 屏幕截图(如果适用)(示例PSOD)
注意:如果控制器未响应,则storcli日志不会捕获任何内容。如果控制器开始响应,请重新启动服务器,然后收集Storcli日志。如果仍然没有响应,请在服务器重新启动之前和之后收集server_techsupport。
如何收集Storcli日志
LSIGET是运行实用程序所有命令的脚本。STORCLI是实用程序本身。
注意:请始终从Broadcom网站下载并使用最新的列表。
操作系统已安装
Linux操作系统:
要在Linux操作系统上安装StorCLI,请执行以下步骤。
- 解压缩StorCLI软件包。
- 要安装StorCLI RPM,请运行rpm -ivh <StorCLI-x.xx-x.noarch.rpm>命令。
- 要升级StorCLI RPM,请运行rpm -Uvh <StorCLI-x.xx-x.noarch.rpm>命令。
捕获命令:
./storcli /c0 /eall show phyerrorCounters > Phy.txt
./storcli /c0 show termlog > Termlog.txt
./storcli /c0/eall/sall show all > PD.txt
./storcli /c0/vall show all > VD.txt
./storcli/c0 show eventloginfo > eventlog.txt
./storcli /c0 show pdfailevents > PDFailEvents.txt
下载Linux操作系统的LSIget脚本。
Broadcom支持和服务
ESXI操作系统
步骤1:从此处下载Storcli实用程序:Broadcom Docs下载
第二步:将storcli.vib从源文件夹复制到ESXi数据存储区。检查自述文件并使用相应的VIB文件。
第三步:如图所示安装storcli实用程序。您需要指定VIB所在的datastore的完整路径。
esxcli软件vib install -v /vmfs/volumes/<datastore>/vmware-esx-storcli.vib —no-sig-check
第四步:导航到/opt/lsi/storcli目录,并执行任何storcli命令以检查实用程序是否可以收集日志。
示例:./storcli /c0 show all
第五步:从此链接下载LSIget实用程序。
Broadcom支持和服务
第六步:选择VMware版本。
步骤 7.将文件复制到主机OS datastore上。
步骤 8运行命令tar -zxvf lsigetvmware_062514.tgz(已更正下载的文件名/版本)。
ESXi 6.0上的输出示例:
/vmfs/volumes/52a767af-784a790c-3505-a44c1129fe2c/LSI # tar -zxvf lsigetvmware_062514.tgz
/vmfs/volumes/52a767af-784a790c-3505-a44c1129fe2c/LSI # ls
lsigetvmware_062514 lsigetvmware_062514.tgz
/vmfs/volumes/52a767af-784a790c-3505-a44c1129fe2c/LSI # cd lsigetvmware_062514/
/vmfs/volumes/52a767af-784a790c-3505-a44c1129fe2c/LSI/lsigetvmware_062514 # ls
Readme.txt all_cli lsigetlunix.sh
/vmfs/volumes/52a767af-784a790c-3505-a44c1129fe2c/LSI/lsigetvmware_062514 # ./lsigetlunix.sh
命令的./lsigetlunix.sh -D -Q版本可用于在安静模式下运行脚本,以减少生产影响。
步骤 9工具成功完成后,会生成tar.gz文件。以上传普通技术支持捆绑包的方式将此文件附加到TAC案例。
未安装操作系统
下载Storcli工具:Broadcom支持和服务
步骤1:从管理软件和工具下载Storcli(链接),提取文件夹并导航到EFI文件夹。获取扩展名为.EFI的Storcli文件,如图所示。
第二步:按任意名称创建新文件夹。此处使用名称EFI创建,并在该文件夹中复制storcli.efi。
启动服务器的KVM,如图所示,导航到虚拟媒体创建映像选项。
浏览以在“从文件夹创建图像”(Create Image from Folder)弹出窗口中提供源文件夹。此处选定的源文件夹是之前创建的EFI文件夹,它包含storcli.efi文件。
此外,浏览该IMG文件的目标路径。如图所示,单击Finish创建IMG文件。
注意:此处使用基于JAVA的KVM从storcli.efi转换为EFI.IMG。
第三步:启动KVM,连接efi(如映像)
第四步:映射EFI映像。
注:请勿勾选“只读”复选框。
如何使用HTML5 KVM将Storcli.efi转换为efi.IMG文件
背景
从CIMC/UCSM 4.1开始,Java KVM不再可用于创建读/写图像文件。此外,从CIMC/UCSM 4.1开始,基于JAVA的KVM不再可用。
详细步骤
步骤A:您需要一台Linux计算机来执行这些步骤。
步骤B : [root@localhost /]# dd if=/dev/zero of=hdd.img bs=1024 count=102400
输入 102400+0 条记录
输出 102400+0 条记录
104857600制了105 MB字节,0.252686秒,415 MB/秒
步骤C: [root@localhost /]# mkfs.msdos hdd.img
mkfs.fat 3.0.20(2013年6月12日)
注:如果您不将MSDOS视为扩展名,则需要安装相应的.RPM,如下所示。使用Yum列表查看软件包是否存在,否则,您需要从Internet或Redhat下载一个软件包。
[root@localhost /]# rpm -ivh dosfstools-3.0.20-10.el7.x86_64.rpm
警告:dosfstools-3.0.20-10.el7.x86_64.rpm:报头V3 RSA/SHA256签名,密钥ID f4a80eb5:NOKEY
正在准备…… ############################### [100%]
正在更新/安装……
1:dosfstools-3.0.20-10.el7 #################### [100%]
步骤D:安装hdd.img
[root@localhost /]# mount -loop hdd.img /mnt/hdd
步骤E:复制所需的文件(storecli.efi文件)
[root@localhost EFI]# cp storcli.efi /mnt/hdd
[root@localhost EFI]#
[root@localhost EFI]# ls
storcli.efi
步骤F:卸载/mnt/hdd
[root@localhost EFI]# umount /mnt/hdd
步骤G:检验hdd.img类型。浏览到目录并运行此处显示的命令。
[root@localhost /]#文件hdd.img
hdd.img:x86引导扇区、mkdosfs引导消息显示、代码偏移0x3c、OEM-ID "mkfs.fat"、扇区/集群4、根条目512、媒体描述符0xf8、扇区/FAT 200、报头64、扇区204800(卷> 32 MB)、保留0x1、序列号0x6f39955b、未标记、FAT(16位)
第H步:使用Winscp或任何其他文件传输工具,复制映像并将其传输到所需的系统。
步骤I:启动HTML5 KVM。单击activate virtual devices > Removable disk > Browse以选择hdd.img copied from Linux machine,然后单击map drive。
第五步:引导到EFI shell后,运行以下命令map -r,如图所示。
第六步:运行此命令fs<X>:其中X =从映射表接收的控制器编号。
步骤 7.运行命令cd EFI。
步骤 8键入ls以确认storcli.efi是否存在。运行命令Storcli.efi show以确认您位于正确的Raid控制器中。现在,您可以看到可用的storcli.efi目录结构,并可从此处运行storcli.efi命令。
运行以下命令以收集日志:
storcli.efi /c0/vall show all >showall.txt
storcli.efi /c0/vall show all > vall.txt
storcli.efi /c0/eall show all >eall.txt
storcli.efi /c0 show termlog > termlog.txt
storcli.efi /c0/eall/sall show all > showall.txt
storcli.efi /c0 show events file > Events.txt
storcli.efi /c0/eall show phyerrorcounters > phy.txt
storcli.efi /c0 show snapdump
storcli.efi /c0 get snapdump id=all file=snapdump.zip
Storcli.efi /c0 show pdfailevents file=pdfailevents.txt
此时,您需要将文件交给Cisco TAC进行分析。卸载.img文件,并将日志上传到Cisco TAC案例。
虚拟驱动器状态和建议的步骤
虚拟驱动器处于最佳状态 — 虚拟驱动器运行状态良好。所有配置的驱动器均在线。
无需操作。
虚拟驱动器已降级 — 虚拟驱动器的运行状态不是最佳状态。其中一个已配置的驱动器发生故障或脱机。
要执行的操作 — 尽快更换驱动器。首先,备份数据。
虚拟驱动器已部分降级 — RAID 6虚拟驱动器中的操作条件不是最佳状态。其中一个已配置的驱动器发生故障或脱机。RAID 6最多可以容忍两个驱动器故障。
要执行的操作 — 尽快更换驱动器。
虚拟驱动器脱机 — 虚拟驱动器不可用于RAID控制器。这实质上是一个失败状态。
要执行的操作 — 将RAID恢复为降级状态并备份数据。立即更换驱动器。
虚拟驱动器已脱机,并且有新的存储控制器 — 虚拟驱动器对于RAID控制器不可用。这实质上是一个失败状态。
要执行的操作 — 不要更换存储控制器。联系TAC寻求帮助。
相关信息