目标
应用策略基础设施控制器(APIC)固态驱动器(SSD)的耐用性随着特定类型的SSD的高使用率而逐渐消失。这会导致SSD写入速度缓慢,并且SSD可变为只读状态。 当SSD驱动器降级时,可能会导致APIC服务中的CPU尖峰。
现场通知:FN - 64329建议使用新的企业级SSD(部件号UCS-SD200G12S3-EP)替换所有产品ID为APIC-SD120G0KS2-EV和/或APIC-SD120GBKS4-EV的APIC SSD(无论使用百分比如何)。
本文档概述了如何确定APIC SSD产品ID以及如何更换受现场通知影响的APIC上的SSD的步骤。
它将补充下面列出的现有SSD更换文档
思科APIC SSD更换版本3.x及更低版本
思科APIC SSD更换版本4.x及更高版本
常见症状
在从2.3开始的ACI版本中,APIC中还会生成一个故障,让您知道何时接近SSD耐用性问题。
F2730: fltEqptStorageWearout-Warning
F2731:fltEqptStorageWearout-Major
F2732:fltEqptStorageWearout-Critical
示例:
故障F2730:“在/dev/sdb上安装的节点x上的存储单元/dev/sdb具有x%的剩余寿命[此故障将提供SSD序列号]”。
故障F2730
此特定SSD耐用性问题存在于两种产品ID为APIC-SD120G0KS2-EV和/或APIC-SD120GBKS4-EV的SSD中。
思科建议您使用新的企业级SSD替换这些SSD(无论使用百分比如何)。
您的APIC SSD是否受到影响 — 如何检查?
要确定APIC SSD产品ID是否受现场通知的影响,请从CIMC GUI获取SSD SN。
对于CIMC 3.0(3)或更高版本
登录到Cisco IMC GUI。
a — 使用切换导航(左上角)、存储、Cisco 12G SAS模块化Raid控制器展开CIMC菜单
b — 点击物理驱动器信息
c — 在左侧的Physical drives(物理驱动器)中,选择PD-1(它应该是SSD)
d — 常规,介质类型应为SSD
e — 查询数据、驱动器序列号和复制序列号
f — 将SSD序列号粘贴到以下网站,并检查SSD序列号是否与受影响的产品ID匹配
g — 您也可以从以下屏幕查看“剩余寿命百分比”以显示使用情况。
https://cway.cisco.com/sncheck/
思科IMC 3.0(4d)
或者
对于3.0(3)之前的CIMC版本
登录到Cisco IMC GUI。
a — 选择存储,Cisco UCSC RAID SAS 200xx
b — 点击物理驱动器信息
c — 从Physical Drives列表中选择SSD
d — 查询数据、驱动器序列号并复制序列号
e — 将SSD序列号粘贴到以下网站,并检查SSD序列号是否与受影响的产品ID匹配
https://cway.cisco.com/sncheck/
思科IMC 2.0(9c)
2 — 如果APIC SSD SN与受影响的产品ID APIC-SD120G0KS2-EV和/或APIC-SD120GBKS4-EV匹配,请使用APIC SSD序列号和CETS CSCvc84794创建TAC案例
在更换SSD之前检查列表
1.如果您的思科IMC版本低于2.0(9c),则必须在更换固态驱动器(SSD)之前升级思科IMC软件。请参阅目标Cisco IMC版本的Cisco IMC 发行版本注释,以确定从当前版本到目标版本的推荐升级路径。每个ACI版本都在ACI版本说明中建议使用Cisco IMC版本。按照当前版本的Cisco Host Upgrade Utility(HUU)用户指南(位于此链接)中的说明执行升级。
2.在Cisco IMC BIOS中,验证受信任的平台模块(TPM)状态设置为“已启用”。 使用KVM控制台访问BIOS设置,您可以在“高级”>“受信任计算”>“TPM状态”下查看和配置TPM状态。
通过思科IMC KVM的APIC BIOS
注意:如果TPM状态为“Disabled”,APIC将无法启动。
3.从思科软件下载站点获取ACI APIC .iso映像。
4.仅当集群中至少有一个具有正常SSD的APIC(完全适合)时,才应执行此过程。如果集群中的所有APIC控制器的SSD出现故障,请向思科技术支持中心(TAC)提交案例。下面的快照来自一个集群,该集群的所有APIC都处于完全适合状态。
APIC GUI 4.1(2g)
5.更换APIC SSD后,必须重新配置APIC,并且需要以下信息[此信息将用于“SSD更换程序步骤4-d”]:
- 交换矩阵名称
- 控制器数量
- 控制器Id
- 隧道终端地址(TEP)的IP地址池
- 网桥域组播地址(GIPO)的IP地址池
- 管理接口速度/双工模式
- 基础设施网络的VLAN ID
- 用于带外管理的IPv4/IPv6地址
- 默认网关的IPv4/IPv6地址
- 强密码检查
使用当天技术说明:如何查找在设置APIC1期间使用的配置值?
SSD更换程序
第 1 步
从集群中的另一个APIC,停用要更换其SSD的APIC。
a — 在菜单栏中,选择System > Controllers。
b — 在Navigation窗格中,展开Controllers > apic_controller_name > Cluster as Seen by Node。对于APIC_controller_name,请指定一个未停用的APIC控制器。
c — 在Work窗格中,验证Active Controllers摘要表中的Health State是否指示集群已完全适应,然后继续。
d — 在同一个“工作”(Work)窗格中,选择要停用的控制器,然后点击操作(Actions)>停用(Decommission)。
e — 点击是。已停用的控制器在Operational State列中显示Unregistered。控制器随后停止服务,不再显示在“工作”(Work)窗格中。
APIC GUI 4.1(2g)
步骤 2
物理移除旧SSD(如果有),然后添加新SSD。
步骤 3
在思科IMC中,使用新安装的SSD创建RAID卷。
对于CIMC版本3.0(3)或更高版本
a — 登录思科IMC。
b — 使用切换导航(左上角)、存储、Cisco 12G SAS模块化Raid控制器展开CIMC菜单
思科IMC 3.0(4d)
c — 单击“Clear Foreign Config”,然后选择“ok”(如果可选择)
d — 点击从未使用的物理驱动器创建虚拟驱动器
思科IMC 3.0(4d)
e - RAID级别,从下拉列表中选择0
f — 创建驱动器组,选择物理驱动器并将其移动到驱动器组
g — 虚拟驱动器属性,选择创建虚拟驱动器
思科CIMC 3.0(4d)
h — 仍在存储中,Cisco 12G SAS模块化Raid控制器,选择虚拟驱动器信息
i — 将RAID级别为RAID 0的虚拟驱动器标识为RAID 0,选择它,然后从下拉菜单中点击Initialize,然后点击Fast Initialize,并选择Initialize VD
思科CIMC 3.0(4d)
对于3.0(3)之前的CIMC版本
a — 登录思科IMC。
b — 选择存储>物理驱动器。选择新添加的物理驱动器。
c — 选择Storage > Controller Drive Info,然后单击Clear Foreign Config(如果可选择)。
d — 点击OK。
e — 选择Storage Controller Drive Info,然后单击Create Virtual Drive from Unused Physical Drives。
思科IMC 2.0(9c)
f — 从Raid Level下拉列表中选择0。
g — 点击创建虚拟驱动器。
思科IMC 2.0(9c)
h — 选择新创建的虚拟驱动器,然后点击Initialize。
i — 从下拉列表中选择Initialize Type并点击Fast Initialize。
思科IMC 2.0(9c)
步骤 4
在思科IMC中,使用虚拟介质安装APIC映像。在此步骤中,对SSD进行分区,并将APIC软件安装在HDD上。
注意:有关思科APIC版本4.x或更高版本的全新安装,请参阅思科APIC安装、升级和降级指南。
a — 使用思科IMC vMedia功能安装APIC .iso映像。
b — 启动或重新启动APIC控制器。
思科IMC 3.0(4d)
c — 在启动过程中,按F6选择Cisco vKVM映射vDVD作为一次性启动设备。您可能需要输入BIOS密码。默认密码为“password”。
思科IMC 3.0(4d)
思科IMC 3.0(4d)
思科IMC 3.0(4d)
思科IMC 3.0(4d)
d — 在初始启动期间,运行配置脚本。按照屏幕上的说明配置APIC软件的初始设置。使用在检查列表中收集的信息或使用当日的Technote:如何查找APIC1设置期间使用的配置值?
思科IMC 3.0(4d)
e — 安装完成后,取消映射虚拟媒体安装。
思科IMC 3.0(4d)
步骤 5
从集群中的APIC,委托停用的APIC。
a — 选择属于集群的任何其他APIC。从菜单栏中,选择System > Controllers。
b — 在Navigation窗格中,展开Controllers > apic_controller_name > Cluster as Seen by Node。对于apic_controller_name,指定属于集群的任何活动控制器。
c — 在Work窗格中,点击Operational State列中显示Unregistered的已停用控制器。
d — 在“工作”(Work)窗格中,点击操作(Actions)>佣金(Commission)。
e — 在“确认”对话框中,单击“是”。
APIC GUI 4.1(2g)
受委托的控制器将运行状况显示为Fully-fit,将运行状态显示为可用。控制器现在应显示在“工作”(Work)窗格中。
现场通知/漏洞参考
现场通知:FN - 64329 - APIC SSD在固态驱动器的高利用率之后出现降级 — 提供硬件升级
固态驱动器高利用率后的APIC SSD降级 | 故障F2730