Introduzione
In questo documento viene descritto come risolvere i problemi relativi a una scheda Cisco UCS serie C Rack Server mLOM che non è in grado di comunicare con CIMC.
Prerequisiti
Requisiti
Nessun requisito specifico previsto per questo documento.
Componenti usati
Le informazioni fornite in questo documento si basano sulle seguenti versioni software e hardware:
- Cisco Unified Computing System (UCS) C220-M5 con firmware versione 4.0(4i)
- Cisco UCS VIC 1387 con firmware versione 4.3(3b) (adattatore mLOM (LAN on Motherboard) modulare)
Le informazioni discusse in questo documento fanno riferimento a dispositivi usati in uno specifico ambiente di emulazione. Su tutti i dispositivi menzionati nel documento la configurazione è stata ripristinata ai valori predefiniti. Se la rete è operativa, valutare attentamente eventuali conseguenze derivanti dall'uso dei comandi.
Premesse
Il modulo mLOM viene installato nei nodi Cisco UCS Controller, Compute, Object Storage Disk (OSD) Compute e ceph.
Una scheda di interfaccia virtuale (VIC) è la scheda che funge da scheda mLOM nel server UCS.
L'adattatore mLOM VIC è un'unità FRU (Field Replaceable Unit) installata nei server di controller, elaborazione e storage in base ai requisiti di rete Undercloud e Overcloud.
- Il server controller dispone di un mLOM con due porte 10GigE, un LOM con due porte da 1 Gb e una porta CIMC (Cisco Integrated Management Controller) da 1 Gb.
- Il server di elaborazione dispone di un mLOM con 2 porte 10GigE, 1 LOM con 2 porte 1 Gb, 2 schede PCIe negli slot 1 e 4 con 2 schede 10GigE e 1 scheda GigE CIMC.
- Il server di elaborazione OSD dispone di un mLOM con 2 porte 10GigE, 1 LOM con 2 porte Gb e 2 schede PCIe negli slot 1 e 4 con 2 porte 10GigE, 10GigE e 1 porta CIMC Gb.
- Il server di storage dispone di un mLOM con due porte 10GigE, un LOM con due porte Gb e una porta CIMC da 1 Gb.
Le interfacce mLOM servono il provisioning overcloud, la gestione VNF e l'orchestrazione, fornendo interfacce di rete VIM per varie reti. Tali reti possono includere reti IP mobili esterne, reti API interne, reti di archiviazione, reti di gestione dello storage e reti tenant.
Risolvere i problemi di comunicazione tra mLOM e CIMC per contribuire al mantenimento delle funzioni all'interno di queste reti.
Sintomi
Sintomo 1. Nell'interfaccia utente di CIMC viene visualizzato il messaggio "Unable to communication with the Adapter Card - mLOM" (Impossibile comunicare con la scheda - mLOM)
Quando si accede a Networking/Adapter Card - mLOM in UCS CIMC, la GUI visualizza il messaggio "Unable to communication with the Adapter Card - mLOM" (Impossibile comunicare con la scheda - mLOM). Ricaricare WebUI per ottenere i dati più recenti."
Sintomo 2. Il modello mLOM non viene visualizzato nell'elenco delle schede di rete UCS
La voce mLOM non è presente nell'elenco degli adattatori del file del supporto tecnico UCS con etichetta tech_support.frupids, che si trova nel percorso del file del supporto tecnico UCS <TMP > tech_support.frupids>.
In circostanze normali, il valore mLOM viene visualizzato nell'elenco delle schede di supporto tecnico UCS tech_support_frupids.
AdapterList:
…
Slot: MLOM
Description: Cisco UCS VIC1387 Virtual Interface Card - Dual Port 40Gb QSFP+ MLOM
PID: UCSC-MLOM-C40Q-03
CPN: xxxxx
powMin: xxxxx
powMax: xxxxx
Vendor: xxxxx
Device: xxxxx
SubVendor: xxxxx
SubDevice: xxxxx
Sintomo 3. Il modello mLOM non viene visualizzato negli output dello chassis nell'ambito della CLI di CIMC per "scope adapter mlom"
C220-node/chassis # scope adapter mlom
Error: Managed object does not exist, use show command to list valid targets
Sintomo 4. Il LOM non viene rilevato dai sensori IPMI
La scheda mLOM non viene rilevata dai sensori IPMI (Intelligent Platform Management Interface) in base al file di supporto tecnico UCS <UCS Tech support > tmp > tech_support>.
Running: dumpIPMISensors
Querying All IPMI Sensors:
Sensor Name | Reading | Unit | Status | LNR | LC | LNC | UNC | UC | UNR |
=================|=========|==============|========|=========|=========|=========|=========|=========|=========|
MLOM_PRSNT | disc -> | discrete | 0x0280 | na | na | na | na | na | na |
MLOM_TEMP | 38.000 | degrees C | OK | na | na | na | na | 90.000 | 95.000 |
Rilevamento parziale scheda mLOM
Il CIMC osserva l'inventario dei server attraverso i sensori e le connessioni della scheda madre del server, ma il sistema operativo del server osserva l'hardware attraverso i canali dati del server. Poiché CIMC e l'inventario del sistema operativo del server utilizzano percorsi fisici diversi per monitorare la scheda mLOM, è possibile rilevare parzialmente la scheda mLOM o i dati dell'inventario CIMC possono mostrare risultati diversi rispetto al sistema operativo del server.
- L'mLOM può essere visualizzato nel record FRU (Field Replaceable Unit) <UCS Tech Support > TMP > tech_support.frupids>.
====== Dumping IPMI FRU Records ======
…
FRU Device Description : FRU_MLOM (ID
Board Mfg : Cisco Systems Inc
Board Product : UCSC-MLOM-C40Q-03
Board Serial : FCH2328764C
Board Part Number : 73-17793-06
Board Extra : A03V04
Board Extra : 0000000000
OEM (0xUnknown (0x9)) Record
- La presenza di mLOM può sembrare stata confermata nei decodici SEL del supporto tecnico UCS <UCS Tech Support > var > sel_decode>.
Id: 757
severity: Normal
dateTime: 2023-12-29 11:08:15 EST
dateTimeOrder: 00028
description: "FRU_MLOM MLOM_PRSNT: Presence sensor for FRU_MLOM, Device Inserted / Device Present was asserted"
- Il registro tecnico del BIOS <UCS Tech Support > mnt > jffs2 > BIOS > bt > BiosTech.log> può indicare che la scheda mLOM è stata rilevata in precedenza.
7:2023 Dec 29 11:04:33 EST:mLomPresent = TRUE
7:2023 Dec 29 11:04:33 EST:mLomSku = mLOM-x8
- Il modulo mLOM può essere visualizzato nell'elenco UCS Tech Support Inventory Adapter e nell'elenco FRU Details <UCS Tech Support > var > inventory-all>.
Adapter List
slot-number: MLOM
serial-number: FCH2328764C
card-type: 81
asic-type: 1
product-id: UCSC-MLOM-C40Q-03
asic-name: cruz
hw-part-no: 73-17793-06
hw-revision: 3
i2cLogicalBus: 112
new-card: no
active: no
standby-power: no
overtemp-condition: no
fan-running: no
ncsiPackageId: 1
eth-interface: eth0
bmc-mac0: 2c:f8:9b:29:7d:de
bmc-mac1: 2c:f8:9b:29:7d:df
cruz-mac: 2c:f8:9b:29:7d:c2
ipAddress: 127.16.3.1
remoteIPAddress: 127.16.3.2
virtual-eth-if: eth0_m3.4043
actions-blocked: yes
capabilities: 0x1
diagnostic-mode: no
UCSM-mode: Standalone
description:
...
FRU Details
FRU_MLOM(ID8)
Board Mfg : Cisco Systems Inc
Board Product : UCSC-MLOM-C40Q-03
Board Serial : FCH2328764C
Board Part Number : 73-17793-06
Board Extra : A03V04
Board Extra : 0000000000
OEM (0xUnknown (0x9)) Record
- l'mLOM può essere visualizzato negli output <show detail> dell'ambito della scheda mLOM della CLI di CISCO.
C220-WZP2204006C /chassis # scope adapter MLOM
C220-WZP2204006C /chassis/adapter # show detail
PCI Slot MLOM:
Product Name: N/A
Serial Number: FCH22127H6J
Product ID: UCSC-MLOM-C40Q-03
Adapter Hardware Revision: 3
Current FW Version: N/A
VNTAG: N/A
FIP: N/A
LLDP: N/A
PORT CHANNEL: N/A
Configuration Pending:
Cisco IMC Management Enabled: no
VID: N/A
Vendor: N/A
Description:
Bootloader Version: N/A
FW Image 1 Version: N/A
FW Image 1 State: N/A
FW Image 2 Version: N/A
FW Image 2 State: N/A
FW Update Status: N/A
FW Update Error: N/A
FW Update Stage: N/A
FW Update Overall Progress: N/A
Procedura di risoluzione dei problemi
Tra un passaggio e l'altro, verificare se la scheda mLOM può essere visualizzata nelle uscite dello chassis dell'ambito di <show pci-adapter>.
Nota: 'Non caricato' può ancora apparire in questi output a causa dello stato del server, piuttosto che qualsiasi problema nella comunicazione con la scheda mLOM.
C220-node# scope chassis
C220-node /chassis # show pci-adapter
Slot Vendor ID Device ID SubVendor ID SubDevice ID Firmware Version Product Name Option ROM Status
---------- ---------- ---------- ------------- ------------- ------------- ------------------------- ----------
MLOM 0x1137 0x0042 0x1137 0x015d 4.3(3b) Cisco UCS VIC 1387 MLOM Not-Loaded <<<<<<<<<<<<
MRAID 0x1000 0x0014 0x1137 0x020e 51.10.0-3151 Cisco 12G Modular Raid... Not-Loaded
L 0x8086 0x1563 0x1137 0x01a3 0x80000EC9... Intel X550 LOM Not-Loaded
Passaggio 1. Verifica connessioni fisiche
Tracciare i cavi dalle due porte del sistema operativo mLOM allo switch di rete per assicurarsi che non siano danneggiati. Se necessario, sostituire i cavi e l'SFP (Small Form-Factor Pluggable).
- Scollegare e ricollegare gli SFP sull'estremità del server e valutare la connettività mLOM.
- Scollegare e ricollegare gli SFP sulla scheda mLOM e verificare la connettività mLOM.
Passaggio 2. Confermare che nel BIOS tutte le porte siano abilitate. Se non sono abilitate, abilitarle.
Passaggio 2.1. Accedere al BIOS sul server riavviando il server e facendo clic su F2 per accedere all'utility di setup dell'app.
Passaggio 2.2. Nel menu BIOS, passare a Opzioni LOM avanzate e PCI e verificare che tutte le porte LOM integrate siano abilitate.
Passaggio 2.3. Passare a Slot PCIe - Dettagli inventario. I dettagli della scheda mLOM dello slot devono essere visualizzati qui. Ad esempio, Manca il LOM dello slot.
Passaggio 3. Riavviare CIMC
Con il riavvio CIMC viene riavviato solo il management plane CIMC. Il piano dati del server non è interessato.
Passaggio 3.1. Immettere la modalità di comando CIMC, Server# scope cimc.
Passaggio 3.2. Riavviare CIMC utilizzando Server /cimc # reboot.
Passaggio 4. Eseguire Cisco UCS Host Upgrade Utility (HUU) per aggiornare nuovamente l'UCS
Passaggio 4.1. Raccogliere la versione del firmware usando il comando <show brief>.
Running: showBrief
Fri Dec 29 11:13:29 EST 2023
BMC Version Info
ver: 4.0(4i) <<<<<<<< Firmware Version
Passaggio 4.2. Dal sito Web Cisco Software Download, scaricare l'utility di aggiornamento dell'host Cisco UCS appropriata per la versione del firmware UCS.
https://software.cisco.com/download/home
Ad esempio, per un UCS C220 M5 con versione 4.0(4i), la versione corretta dell'utility è ucs-c220m5-huu-4.0.4i.iso.
https://software.cisco.com/download/home/286318809/type/283850974/release/4.0(4i)
Passaggio 4.3. Aggiornare il firmware UCS usando la procedura descritta nella sezione 'Updating Firmware Using the Update All Option' nel manuale Cisco Host Upgrade Utility User Guide' per lo stesso modello di server Cisco UCS.
Ad esempio, per un server modello UCS C220 M5, la guida per l'aggiornamento del firmware è disponibile all'indirizzo: https://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/c/sw/lomug/2-0-x/3_0/b_huu_3_0_1/b_huu_2_0_13_chapter_011.html.
- Se l'HUU genera un prompt che indica che le versioni in esecuzione e quelle in pacchetto sono uguali, ignorare l'aggiornamento. Durante la procedura di riflessione, il firmware corretto è già in funzione in questo server UCS.
- Verificare se l'unità Cisco HUU indica la presenza della scheda mLOM. Di seguito è riportato un esempio dell'utilità Cisco HUU che non mostra la scheda mLOM.
Passaggio 5. Ricollocare fisicamente la scheda adattatore mLOM
Riposizionare fisicamente la scheda dell'adattatore mLOM, seguendo la procedura descritta in 'Sostituzione di una scheda mLOM' nella 'Guida all'installazione e ai servizi del server' per lo stesso modello di server Cisco UCS.
Ad esempio, per un server modello UCS C220 M5, la guida per riposizionare il mLOM è disponibile all'indirizzo: https://www.cisco.com/c/en/us/td/docs/unified_computing/ucs/c/hw/C220M5/install/C220M5/C220M5_chapter_010.html#task_zz5_h1m_3z.
Conclusioni
Se sono state verificate le connessioni fisiche e le porte del BIOS, è stato eseguito un riavvio a freddo sul CIMC, il firmware del server è stato aggiornato con il firmware corretto e il mLOM è stato riposizionato fisicamente, ma la scheda mLOM non viene visualizzata negli output di <show pci-adapter>, è possibile concludere un errore hardware del mLOM. In tal caso, sostituire la scheda mLOM.
Informazioni correlate