简介
本文档旨在介绍思科统一计算系统(UCS)C系列产品的集成、故障排除和最佳实践。
UCS C系列集成基本连接概述
- 统一计算系统管理器(UCSM)集成在UCSM版本1.4中引入,适用于具有单独基础设施进行管理的小规模部署。
- 从2.0(2)版开始,对集成服务器的可扩展主流支持开始。
- 随着UCSM版本2.1和2.2中新硬件和软件的发布,集成和连接不断发展。
- 目前,UCSM集成C系列机架式服务器支持3种主要连接模式。
- 双线管理
- 单连接(即单线管理)
- 直接连接到交换矩阵互联
- C系列服务器中的多个PCIe插槽提供各种支持的连接选项
先决条件
了解UCS B和C系列服务器
http://www.cisco.com/c/en/us/products/servers-unified-computing/index.html
采用FEX的双线管理
http://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/c-series_integration/ucsm2-0-2/b_UCSM_202_C-Integration/b_UCSM_202_C-Integration_chapter_01.html#reference_D893866B8BDF451DB568FA67912E3317
通过FEX实现单连接(即单线管理)
http://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/c-series_integration/ucsm2-1/b_UCSM2-1_C-Integration/b_UCSM2-1_C-Integration_chapter_010.html
直接连接到交换矩阵互联,无FEX
http://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/c-series_integration/ucsm2-2/b_C-Series-Integration_UCSM2-2/b_C-Series-Integration_UCSM2-2_chapter_0110.html
对于Cisco UCS C220 M4和Cisco UCS C240 M4服务器,您可以使用模块化板载局域网(MLOM)或虚拟接口卡(VIC)在单连接或直接连接模式下与Cisco UCS Manager集成。连接适配器的选择如下所述:
- 仅MLOM:当服务器中仅存在MLOM时,默认情况下连接适配器为MLOM,
- MLOM和VIC适配器:MLOM是默认连接适配器。
- 无MLOM:
- 无MLOM和VIC:不支持SingleConnect或直接连接。
冗余PCIe适配器支持
- 必须连接冗余适配器,以便每个卡都连接到集群中交换矩阵的两端
如果您处于适当的UCSM软件级别,则单个UCS域内支持多种连接类型。
要求
发现基础
- 默认情况下,当使用支持的连接模式之一插入UCS交换矩阵时,工厂新的UCS C系列服务器将自动发现。
- 您必须满足最低要求,但一般可以发现采用思科集成管理控制器(CIMC)1.4(4)版或更高版本的C系列服务器。
- 按您希望的方式(如双线或单线)插入服务器。
- 验证您的服务器是否达到支持集成所需的防火墙的最低级别。
- 默认情况下,管理连接和服务器发现是自动的,您可以使用全局策略控制这一情况。
- 服务器和FEX发现是RACE条件。首先发现一个连接并通电。
- FEX编号与机箱的ID方案相同。如果您有2个机箱,则添加2个FEX,编号将分别为3和4
发现策略
1:FEX发现策略 — 链路数、端口通道与固定
2:机架发现策略 — 立即发现和清点或等待用户操作
3:机架管理连接策略 — 自动发现双线或单线或需要用户输入
故障排除方法
用户确认的服务器发现策略
- 服务器在UCSM中显示,但发现(资产和可用性)不会发生。
- 在用户重新确认服务器之前,总体状态显示为不可操作。
用户确认的管理连接策略
- 选择管理连接类型后,如果没有重新发现(Decom/Recom),则无法更改该类型
混合连接显示
- 对于UCS C系列服务器,您可以通过Equipment(设备) — > Server(服务器) — > Hybrid Display(混合显示)选项卡查看管理和数据的连接路径。
- 这对于排除连接故障和检验管理连接类型非常有用。
- 红色链路表示链路上没有活动VIF。对于非活动的双线服务器,这是正常的。
- 如果将集成服务器重新连接到不同端口,则必须对服务器进行解压缩/重新编码,以使其能够正常运行。
故障排除发现问题
- 服务器正确发现的主要原因
- CIMC设置不是默认设置。(最典型的问题是服务器没有出厂设置)
- CIMC或VIC固件不处于适当级别(CIMC发现1.4(4)的最低要求。
布线不当
初始固件策略
- 只要服务器运行适当级别的固件,就可以发现服务器
- 版本1.4和2.0(1)只能使用CIMC防火墙版本1.2(2l)运行和发现
- 从版本2.0(2)开始,任何在最低版本1.4(4)之后的CIMC FW都允许发现。
- UCSM集成仅支持随适当版本的UCS软件捆绑包打包的防火墙。
- 发现后,所有服务器都应刷新(升级/降级)到受支持的捆绑包。
检查UCSM固件捆绑包
vCon放置策略
- 默认情况下,UCS会自动将虚拟网络接口卡(vNIC)或虚拟主机总线适配器(vHBA)适配器放置到物理适配器上。
- 网络放置策略确定特定vNIC和/或vHBA将分配到哪个物理适配器。
- 当使用多个卡和卡类型时,管理vNIC/vHBA以实现所需的网络连接非常重要。
- VCons是物理适配器的抽象,它提供了一种方法,无论安装了多少个物理卡,都能为服务配置文件提供一致的PCIe映射。
- 设置vNIC和vHBA的所需顺序可让系统自动将其放置到vCON上。
- 创建服务配置文件时,您可以明确放置vNIC以提供确定性连接。
手动为C系列集成服务器指定vNIC/vHBA位置有2个主要原因。
- 防止自动映射到由UCSM(例如C460 LOM或外部连接适配器)未使用的适配器
- 流量工程(例如,一个适配器上的FCoE和另一个适配器上的以太网)。
UCSM本地磁盘策略
除PCIe插槽外,选择C系列服务器的另一个主要外形因素是驱动器配置的数量和灵活性。
- 刀片服务器最多支持4个驱动器,C系列机架式服务器目前最多支持24个驱动器。
- UCSM通过服务配置文件中的本地磁盘策略提供本地驱动器配置的管理。
- 本地磁盘策略的当前实施范围有限,尚不能满足客户的某些要求。为了补偿用户,可以继续使用UCSM之外的工具自定义驱动器配置。
- 为C系列服务器配置本地驱动器的关键是了解本地磁盘策略。
- 本地磁盘策略描述如何使用可用资源在raid控制器上配置逻辑(虚拟)驱动器。
- 保护配置可防止应用本地磁盘策略与控制器上的实际配置不匹配的服务配置文件。
最佳实践
发现的最佳实践
- 即使您有160台服务器环境,也对机架服务器发现策略使用自动确认。
- 如果服务器支持单连接,请布线以实现所需的连接并使用自动确认管理策略。
- 请注意,如果连接LOM和SFP,则Shared-LOM将是系统默认模式。
- 如果在发现共享LOM后删除LOM,则会丢失管理连接。
- 在单连接模式下使用1个以上VIC时,主卡插槽将用于管理。如果该卡发生灾难性故障,则第二张卡上的数据可能会继续,但通过UCSM进行的管理会丢失。
- 在共享LOM和边带之间或在VIC发生故障时建立不同的管理路径时,需要Decom/Recom。
- 启用两个用户确认策略需要2个重新确认
- 首先发现FEX,然后在发现服务器之前对其重新编号,因为您必须使它们脱机,这可能会中断服务器发现。
vCon放置策略配置 — 最佳实践
- 放置策略旨在在具有不同数量适配器的服务器之间移动配置文件时提供一致的PCIe编号。
- 自动放置将足够,除非设置要求严格控制vNIC/vHBA放置。示例包括:
- 具有板载适配器的服务器,可通过UCSM管理,您不希望使用(例如C460)。
- 使用UCSM可发现适配器连接到外部网络(例如Broadcom、Intel等)
- FCoE流量和以太网流量的严格分离。
多卷驱动器管理最佳实践
- 在服务器之间移动服务配置文件时,请始终使用保护配置,除非您的意图是重新配置控制器上的逻辑驱动器,从而破坏驱动器上的所有数据。
- 如果您需要除单个卷或所有驱动器之外的任何配置作为单个RAID 0卷,请使用任何配置的本地磁盘策略。
- 如果您只需要一个卷,并且认为您可能会增加现有卷,或者将来会使用任何配置的本地磁盘策略创建一个额外的卷。
- 如果现有的独立C系列服务器具有逻辑驱动器和这些驱动器上的数据,则如果您关联具有任何配置的本地磁盘策略的服务提供,则仍可在不丢失数据的情况下进行集成。
相关信息
C系列服务器UCSM集成配置示例
http://www.cisco.com/c/en/us/support/docs/servers-unified-computing/ucs-infrastructure-ucs-manager-software/116741-troubleshoot-ucsm-00.html
http://www.cisco.com/c/en/us/support/servers-unified-computing/ucs-c-series-rack-mount-ucs-managed-server-software/products-installation-and-configuration-guides-list.html
http://www.cisco.com/c/en/us/products/collateral/interfaces-modules/ucs-virtual-interface-card-1240/data_sheet_c78-699459.html
https://www.ciscolive.com/online/connect/sessionDetail.ww?SESSION_ID=77758&backBtn=true
已知问题:
CSCup69532 UCSM“删除”服务器功能不起作用