Problemen oplossen bij servers in CNDP-oplossing

Downloadopties

PDF (134.8 KB)
Met Adobe Reader op diverse apparaten bekijken
ePub (82.7 KB)
Bekijken in diverse apps op iPhone, iPad, Android, Sony Reader of Windows Phone
Mobi (Kindle) (68.7 KB)
Op Kindle-apparaat of via Kindle-app op meerdere apparaten bekijken

Bijgewerkt:26 mei 2022

Document-id:217899

Inclusief taalgebruik

De documentatie van dit product is waar mogelijk geschreven met inclusief taalgebruik. Inclusief taalgebruik wordt in deze documentatie gedefinieerd als taal die geen discriminatie op basis van leeftijd, handicap, gender, etniciteit, seksuele oriëntatie, sociaaleconomische status of combinaties hiervan weerspiegelt. In deze documentatie kunnen uitzonderingen voorkomen vanwege bewoordingen die in de gebruikersinterfaces van de productsoftware zijn gecodeerd, die op het taalgebruik in de RFP-documentatie zijn gebaseerd of die worden gebruikt in een product van een externe partij waarnaar wordt verwezen. Lees meer over hoe Cisco gebruikmaakt van inclusief taalgebruik.

Over deze vertaling

Cisco heeft dit document vertaald via een combinatie van machine- en menselijke technologie om onze gebruikers wereldwijd ondersteuningscontent te bieden in hun eigen taal. Houd er rekening mee dat zelfs de beste machinevertaling niet net zo nauwkeurig is als die van een professionele vertaler. Cisco Systems, Inc. is niet aansprakelijk voor de nauwkeurigheid van deze vertalingen en raadt aan altijd het oorspronkelijke Engelstalige document (link) te raadplegen.

Inhoud

Inleiding

Achtergrondinformatie

Probleem

Oplossing

Voorbeelden van uitvoer voor containers

Voorbeeld-uitvoer voor VMs

SSH in de UCS-host

Inleiding

Dit document beschrijft hoe u een Unified Computing System (UCS) kunt identificeren en de foutmeldingen aldaar in het Cloud Native Deployment Platform (CNDP) kunt controleren.

Achtergrondinformatie

De hardware-gerelateerde waarschuwingen worden gerapporteerd in de Ultra Cloud Core Subscriber Microservices Infrastructuur (SMI) Cluster Manager (CM) Common Executive Environment (CEE). De Kubernetes (K8s), de docker, enzovoort, worden over verwante informatie gerapporteerd in de virtuele IP van CM (VIP).

Voorzichtig: Raadpleeg de vragenlijst over netwerkontwerp en klantinformatie (CIQ) om de IP’s te controleren.

Probleem

De fout "Alarm voor apparatuur" wordt gemeld in waarschuwingsberichten.

Meld u aan bij CM-CEE, voer de opdracht uit om waarschuwingen in actieve details te tonen en geef een overzicht van de waarschuwingen in om alle actieve berichten en geschiedeniswaarschuwingen weer te geven.
Merk op dat de server IP in de waarschuwing is gemeld.

[lab-deployer/labceec01] cee# show alerts active detail 
alerts active detail server-alert 9c367ce5ee48
 severity    major
 type        "Equipment Alarm"
 startsAt    2021-10-27T17:10:37.025Z
 source      10.10.10.10
 summary     "DDR4_P1_C1_ECC: DIMM 5 is inoperable : Check or replace DIMM"
 labels      [ "alertname: server-alert" "cluster: cr-chr-deployer" "description: DDR4_P1_C1_ECC: DIMM 5 is inoperable : Check or replace DIMM" "fault_id: sys/rack-unit-1/board/memarray-1/mem-5/fault-F0185" "id: 134219020" "monitor: prometheus" "replica: cr-chr-deployer" "server: 10.10.10.10" "severity: major" ]
 annotations [ "dn: cr-chr-deployer/10.10.10.10/sys/rack-unit-1/board/memarray-1/mem-5/fault-F0185/134219020" "summary: DDR4_P1_C1_ECC: DIMM 5 is inoperable : Check or replace DIMM" "type: Equipment Alarm" ]

[lab-deployer/labceec01] cee# show alerts history summary
NAME      UID           SEVERITY  STARTS AT       DURATION  SOURCE       SUMMARY            
---------------------------------------------------------------------------------------------
vm-alive  f6a65030b593  minor     09-02T10:28:28  1m40s     10-192-0-13  labd0123 is alive. 
vm-error  3a6d840e3eda  major     09-02T10:27:18  1m        10-192-0-13  labd0123 is down.  
vm-alive  49b2c1941dc6  minor     09-02T10:25:38  1m40s     10-192-0-14  labd0123 is alive.

Oplossing

Identificeer de services (containers) en/of virtuele machine (VM) of op Kernel gebaseerde virtuele machine (KVM) die op de server in het SMI CM worden gehost, voer de opdracht show-in-configuratie uit en vind de configuratie voor de server-IP.

Inloggen bij de CM VIP (gebruikersnaam: wolkengebruiker)
Haal de IP van OPS Center voor de smi-cm naamruimte
Meld u aan bij het OPS Center en controleer de clusterconfiguratie
Identificeer knooppunten en VM's die op de server worden uitgevoerd

cloud-user@lab-deployer-cm-primary:~$ kubectl get svc -n smi-cm
NAME                                          TYPE        CLUSTER-IP       EXTERNAL-IP      PORT(S)                                                 AGE
cluster-files-offline-smi-cluster-deployer    ClusterIP   10.102.200.178   <none>           8080/TCP                                                98d
iso-host-cluster-files-smi-cluster-deployer   ClusterIP   10.102.100.208     192.168.1.102    80/TCP                                                  98d
iso-host-ops-center-smi-cluster-deployer      ClusterIP   10.102.200.73    192.168.1.102    3001/TCP                                                98d
netconf-ops-center-smi-cluster-deployer       ClusterIP   10.102.100.207   192.168.184.193   3022/TCP,22/TCP                                         98d
ops-center-smi-cluster-deployer               ClusterIP   10.10.20.20     <none>           8008/TCP,2024/TCP,2022/TCP,7681/TCP,3000/TCP,3001/TCP   98d
squid-proxy-node-port                         NodePort    10.102.60.114    <none>           3128:32261/TCP                                          98d

cloud-user@lab-deployer-cm-primary:~$ ssh -p 2024 admin@10.10.20.20
admin@10.10.20.20's password:
      Welcome to the Cisco SMI Cluster Deployer on lab-deployer-cm-primary
      Copyright © 2016-2020, Cisco Systems, Inc.
      All rights reserved.
admin connected from 192.168.1.100 using ssh on ops-center-smi-cluster-deployer-7848c69844-xzdw6
[lab-deployer-cm-primary] SMI Cluster Deployer# show running-config clusters

Voorbeelden van uitvoer voor containers

In dit voorbeeld wordt de server gebruikt door knooppunt primair-1.

[lab-deployer-cm-primary] SMI Cluster Deployer# show running-config clusters lab01-smf nodes primary-1
clusters lab01-smf
nodes primary-1
  maintenance false
  k8s node-type       primary
  k8s ssh-ip          10.192.10.22
  k8s sshd-bind-to-ssh-ip true
  k8s node-ip         10.192.10.22
  k8s node-labels smi.cisco.com/node-type oam
  exit
  k8s node-labels smi.cisco.com/node-type-1 proto
  exit
  ucs-server cimc user admin
  ucs-server cimc ip-address 10.10.10.10

Voorbeeld-uitvoer voor VMs

De server kan worden gebruikt voor de KVM-gebaseerde VM.

In dit voorbeeld heeft de server gebruikersaanpassingsfuncties (UPF’s) - upf1 en upf2.

[lab-deployer-cm-primary] SMI Cluster Deployer# show running-config clusters lab01-upf nodes labupf
clusters lab01-upf
nodes labupf
  maintenance false
  ssh-ip      10.192.30.7
  type        kvm
  vms upf1
   upf software lab...
...
   type upf
  exit
  vms upf2
   upf software lab...
...
   type upf
  exit
  ucs-server cimc user admin
...
  ucs-server cimc ip-address 10.10.10.10
...
  exit

SSH in de UCS-host

Sluit aan op de UCS-host en controleer foutmeldingen met gamefout, geef foutmeldingen weer en geef foutgeschiedenis weer.

labucs111-cmp1-11 /fault # show fault-entries 
Time Severity Description ------------------------- ------------- --------------------------------------- 
2021-03-26T10:10:10 major "DDR4_P1_C1_ECC: DIMM 19 is inoperable : Check or replace DIMM"

LABCP0222-Server22-02 /fault # show fault-history
Time                Severity      Source          Cause                     Description                             
------------------- ------------- --------------- ------------------------- ----------------------------------------
2021 Dec 10 02:02:02 UTC info          %CIMC           EQUIPMENT_INOPERABLE      "[F0174][cleared][equipment-inoperable][sys/rack-unit-1/board] IERR: A catastrophic fault has occurred on one of the processors: Cleared "
2021 Dec 1 01:01:01 UTC critical      %CIMC           EQUIPMENT_INOPERABLE      "[F0174][critical][equipment-inoperable][sys/rack-unit-1/board] IERR: A catastrophic fault has occurred on one of the processors: Please check the processor's status. "

Revisiegeschiedenis

Revisie	Publicatiedatum	Opmerkingen
1.0	26-May-2022	Eerste vrijgave

Bijgedragen door Cisco-engineers

Cinthia Janneth Martinez
Cisco TAC-ingenieur
Nebojsa Kosanovic
Cisco TAC-ingenieur

Was dit document nuttig?

Feedback

Contact Cisco

Een ondersteuningscase openen
(Vereist een Cisco-servicecontract)

Problemen oplossen bij servers in CNDP-oplossing

Downloadopties

Inclusief taalgebruik

Over deze vertaling

Inhoud

Inleiding

Achtergrondinformatie

Probleem

Oplossing

Voorbeelden van uitvoer voor containers

Voorbeeld-uitvoer voor VMs

SSH in de UCS-host

Revisiegeschiedenis

Bijgedragen door Cisco-engineers

Was dit document nuttig?

Contact Cisco

Dit document is van toepassing op deze producten