Introdução
Este documento descreve como solucionar problemas de uma placa Cisco UCS C-Series Rack Server mLOM que não consegue se comunicar com o CIMC.
Pré-requisitos
Requisitos
Não existem requisitos específicos para este documento.
Componentes Utilizados
As informações neste documento são baseadas nestas versões de software e hardware:
- Cisco Unified Computing System (UCS) C220-M5 executando firmware versão 4.0(4i)
- Cisco UCS VIC 1387 executando a versão 4.3(3b) do firmware (este é o adaptador modular LAN na placa-mãe (mLOM))
As informações neste documento foram criadas a partir de dispositivos em um ambiente de laboratório específico. Todos os dispositivos utilizados neste documento foram iniciados com uma configuração (padrão) inicial. Se a rede estiver ativa, certifique-se de que você entenda o impacto potencial de qualquer comando.
Informações de Apoio
O mLOM é instalado nos nós controlador, computação, computação de disco de armazenamento de objetos (OSD) e ceph do Cisco UCS.
Uma placa de interface virtual (VIC) é o adaptador que serve como a placa mLOM no servidor UCS.
O adaptador VIC mLOM é uma unidade substituível em campo (FRU) que é colocada em servidores de controlador, computação e armazenamento, com base nos requisitos de rede Undercloud e Overcloud.
- O servidor do controlador tem um mLOM com duas portas de 10 GigE, um LOM com duas portas de 1 Gb e uma porta Cisco Integrated Management Controller (CIMC) de 1 Gb.
- O servidor de computação tem um mLOM com duas portas de 10 GigE, um LOM com duas portas de 1 Gb, duas placas PCIe nos slots 1 e 4 com 2x10 GigE e CIMC de 1 GigE.
- O servidor de computação OSD tem um mLOM com duas portas de 10 GigE, um LOM com duas portas de 2 Gbit e duas placas PCIe nos slots 1 e 4 com duas portas de 10 GigE e portas CIMC de 1 Gbit.
- O servidor de armazenamento tem um mLOM com duas portas de 10 GigE, um LOM com duas portas de 1 Gb e uma porta CIMC de 1 Gb.
As interfaces mLOM servem provisionamento Overcloud, Gerenciamento VNF e Orquestração, fornecendo interfaces de rede VIM para várias redes. Essas redes podem incluir redes IP flutuantes externas, redes API internas, redes de armazenamento, redes de gerenciamento de armazenamento e redes de usuários.
Solucionar problemas de comunicação entre o mLOM e o CIMC para ajudar a manter as funções nessas redes.
Sintomas
Sintoma 1. A GUI do CIMC exibe "Unable to communication with the Adapter Card - mLOM" (Não foi possível se comunicar com a placa adaptadora - mLOM)
Ao acessar a placa de rede/adaptador - mLOM no CIMC do UCS, a GUI apresenta a mensagem "Unable to communication with the Adapter Card - mLOM. Recarregue a WebUI para obter os dados mais recentes."
Sintoma 2. O mLOM não aparece na lista de adaptadores UCS
A entrada mLOM está ausente da lista de adaptadores no arquivo de suporte técnico do UCS rotulado tech_support.frupids, localizado no caminho do arquivo de suporte técnico do UCS <TMP > tech_support.frupids>.
Em circunstâncias normais, o mLOM aparece na lista de adaptadores tech_support_frupids do suporte técnico do UCS.
AdapterList:
…
Slot: MLOM
Description: Cisco UCS VIC1387 Virtual Interface Card - Dual Port 40Gb QSFP+ MLOM
PID: UCSC-MLOM-C40Q-03
CPN: xxxxx
powMin: xxxxx
powMax: xxxxx
Vendor: xxxxx
Device: xxxxx
SubVendor: xxxxx
SubDevice: xxxxx
Sintoma 3. O mLOM não aparece nas saídas do chassi de escopo da CLI do CIMC para "scope adapter mlom"
C220-node/chassis # scope adapter mlom
Error: Managed object does not exist, use show command to list valid targets
Sintoma 4. O mLOM não é detectado pelos sensores IPMI
A placa mLOM não é detectada pelos sensores IPMI (Intelligent Platform Management Interface), de acordo com o arquivo de suporte técnico do UCS <UCS Tech support > tmp > tech_support>.
Running: dumpIPMISensors
Querying All IPMI Sensors:
Sensor Name | Reading | Unit | Status | LNR | LC | LNC | UNC | UC | UNR |
=================|=========|==============|========|=========|=========|=========|=========|=========|=========|
MLOM_PRSNT | disc -> | discrete | 0x0280 | na | na | na | na | na | na |
MLOM_TEMP | 38.000 | degrees C | OK | na | na | na | na | 90.000 | 95.000 |
Detecção parcial de placa mLOM
O CIMC observa o inventário do servidor através de sensores e conexões na placa-mãe do servidor, mas o sistema operacional do servidor observa o hardware através dos canais de dados do servidor. Como o CIMC e o inventário do sistema operacional do servidor usam caminhos físicos diferentes para monitorar a placa mLOM, a placa mLOM pode ser parcialmente detectada ou os dados de inventário do CIMC podem mostrar resultados diferentes dos do sistema operacional do servidor.
- O mLOM pode ser exibido no Registro de FRU (Field Replaceable Unit, unidade substituível em campo) <UCS Tech Support > TMP > tech_support.frupids>.
====== Dumping IPMI FRU Records ======
…
FRU Device Description : FRU_MLOM (ID
Board Mfg : Cisco Systems Inc
Board Product : UCSC-MLOM-C40Q-03
Board Serial : FCH2328764C
Board Part Number : 73-17793-06
Board Extra : A03V04
Board Extra : 0000000000
OEM (0xUnknown (0x9)) Record
- A presença do mLOM pode parecer ter sido declarada no UCS Tech Support SEL Decodes <UCS Tech Support > var > sel_decode>.
Id: 757
severity: Normal
dateTime: 2023-12-29 11:08:15 EST
dateTimeOrder: 00028
description: "FRU_MLOM MLOM_PRSNT: Presence sensor for FRU_MLOM, Device Inserted / Device Present was asserted"
- O registro técnico do BIOS <UCS Tech Support > mnt > jffs2 > BIOS > bt > BiosTech.log> pode mostrar que a placa mLOM foi detectada anteriormente.
7:2023 Dec 29 11:04:33 EST:mLomPresent = TRUE
7:2023 Dec 29 11:04:33 EST:mLomSku = mLOM-x8
- O mLOM pode ser exibido na lista Adaptador de inventário de suporte técnico do UCS e na lista Detalhes de FRU <Suporte técnico do UCS > var > inventory-all>.
Adapter List
slot-number: MLOM
serial-number: FCH2328764C
card-type: 81
asic-type: 1
product-id: UCSC-MLOM-C40Q-03
asic-name: cruz
hw-part-no: 73-17793-06
hw-revision: 3
i2cLogicalBus: 112
new-card: no
active: no
standby-power: no
overtemp-condition: no
fan-running: no
ncsiPackageId: 1
eth-interface: eth0
bmc-mac0: 2c:f8:9b:29:7d:de
bmc-mac1: 2c:f8:9b:29:7d:df
cruz-mac: 2c:f8:9b:29:7d:c2
ipAddress: 127.16.3.1
remoteIPAddress: 127.16.3.2
virtual-eth-if: eth0_m3.4043
actions-blocked: yes
capabilities: 0x1
diagnostic-mode: no
UCSM-mode: Standalone
description:
...
FRU Details
FRU_MLOM(ID8)
Board Mfg : Cisco Systems Inc
Board Product : UCSC-MLOM-C40Q-03
Board Serial : FCH2328764C
Board Part Number : 73-17793-06
Board Extra : A03V04
Board Extra : 0000000000
OEM (0xUnknown (0x9)) Record
- O mLOM pode aparecer nas saídas do escopo do adaptador mLOM da CLI do CIMC <show detail>.
C220-WZP2204006C /chassis # scope adapter MLOM
C220-WZP2204006C /chassis/adapter # show detail
PCI Slot MLOM:
Product Name: N/A
Serial Number: FCH22127H6J
Product ID: UCSC-MLOM-C40Q-03
Adapter Hardware Revision: 3
Current FW Version: N/A
VNTAG: N/A
FIP: N/A
LLDP: N/A
PORT CHANNEL: N/A
Configuration Pending:
Cisco IMC Management Enabled: no
VID: N/A
Vendor: N/A
Description:
Bootloader Version: N/A
FW Image 1 Version: N/A
FW Image 1 State: N/A
FW Image 2 Version: N/A
FW Image 2 State: N/A
FW Update Status: N/A
FW Update Error: N/A
FW Update Stage: N/A
FW Update Overall Progress: N/A
Passos de Troubleshooting
Entre cada etapa, verifique se a placa mLOM pode ser vista nas saídas do chassi de escopo de <show pci-adapter>.
Observação: 'Not-Loaded' ainda pode aparecer nessas saídas devido ao estado do servidor, em vez de qualquer problema na comunicação com a placa mLOM.
C220-node# scope chassis
C220-node /chassis # show pci-adapter
Slot Vendor ID Device ID SubVendor ID SubDevice ID Firmware Version Product Name Option ROM Status
---------- ---------- ---------- ------------- ------------- ------------- ------------------------- ----------
MLOM 0x1137 0x0042 0x1137 0x015d 4.3(3b) Cisco UCS VIC 1387 MLOM Not-Loaded <<<<<<<<<<<<
MRAID 0x1000 0x0014 0x1137 0x020e 51.10.0-3151 Cisco 12G Modular Raid... Not-Loaded
L 0x8086 0x1563 0x1137 0x01a3 0x80000EC9... Intel X550 LOM Not-Loaded
Etapa 1. Verificar conexões físicas
Rastreie os cabos das duas portas no mLOM até o switch de rede para garantir que não sejam danificados. Substitua os cabos e o Small Form-fator Pluggable (SFP), se necessário.
- Desconecte e reconecte os SFPs na extremidade do servidor e avalie a conectividade mLOM.
- Desconecte e reconecte os SFPs na placa mLOM e avalie a conectividade mLOM.
Etapa 2. Confirme se o BIOS tem todas as portas ativadas. Se Não Estiverem Habilitadas, Habilite As Portas.
Etapa 2.1. Acesse o BIOS no servidor reinicializando o servidor e clicando em F2 para entrar no Aptio Setup Utility (Utilitário de configuração de aplicativo).
Etapa 2.2. No menu do BIOS, navegue para Advanced LOM and PCI options (Opções avançadas de LOM e PCI) e verifique se All Onboard LOM Ports (Todas as portas LOM integradas) está habilitado.
Etapa 2.3. Navegue até PCIe Slots Inventory Details (Detalhes do inventário de slots PCIe). Os detalhes da placa mLOM do slot devem ser mostrados aqui. Por exemplo, Ausência de Slot mLOM.
Etapa 3. Reinicialize o CIMC
Uma reinicialização do CIMC apenas reinicializa o plano de gerenciamento do CIMC. O plano de dados do servidor não é afetado.
Etapa 3.1. Entre no modo de comando CIMC, Server# scope cimc.
Etapa 3.2. Reinicialize o CIMC usando Server /cimc # reboot.
Etapa 4. Execute o Cisco UCS Host Upgrade Utility (HUU) para atualizar o UCS
Etapa 4.1. Reúna a versão do firmware usando o comando <show brief>.
Running: showBrief
Fri Dec 29 11:13:29 EST 2023
BMC Version Info
ver: 4.0(4i) <<<<<<<< Firmware Version
Etapa 4.2. No site de download de software da Cisco, baixe o Cisco UCS Host Upgrade Utility apropriado para a versão do firmware do UCS.
https://software.cisco.com/download/home
Por exemplo, para um UCS C220 M5 com versão 4.0(4i), a versão correta do utilitário é ucs-c220m5-huu-4.0.4i.iso.
https://software.cisco.com/download/home/286318809/type/283850974/release/4.0(4i)
Etapa 4.3. Atualize o firmware do UCS usando o procedimento listado na seção "Atualizando o firmware usando a opção Atualizar tudo" do "Guia do usuário do Cisco Host Upgrade Utility" para o mesmo servidor Cisco UCS modelo.
Por exemplo, para um servidor do modelo UCS C220 M5, o guia para atualizar o firmware é encontrado em: https://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/c/sw/lomug/2-0-x/3_0/b_huu_3_0_1/b_huu_2_0_13_chapter_011.html.
- Se o HUU produzir um prompt aparecendo indicando que "As versões em execução e empacotadas são as mesmas, ignore a atualização.", durante o procedimento de reflash, o firmware correto já está operando neste servidor UCS.
- Verifique se o Cisco HUU mostra a presença da placa mLOM. Este é um exemplo do utilitário Cisco HUU que não mostra a placa mLOM.
Etapa 5. Recoloque fisicamente a placa adaptadora mLOM
Recoloque fisicamente a placa adaptadora mLOM, usando o procedimento descrito em "Substituindo uma placa mLOM" no "Guia de instalação e serviço do servidor" do mesmo modelo de servidor Cisco UCS.
Por exemplo, para um servidor do modelo UCS C220 M5, o guia para recolocar o mLOM pode ser encontrado em: https://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/c/hw/C220M5/install/C220M5/C220M5_chapter_010.html#task_zz5_h1m_3z.
Conclusão
Se as conexões físicas e as portas do BIOS tiverem sido verificadas, uma reinicialização forçada no CIMC tiver sido executada, o firmware do servidor tiver sido atualizado com o firmware correto e o mLOM tiver sido fisicamente recolocado, mas a placa mLOM não aparecer nas saídas de <show pci-adapter>, uma falha de hardware mLOM pode ser concluída. Nesse caso, substitua a placa mLOM.
Informações Relacionadas