Inleiding
Dit document beschrijft een op RCM gebaseerde UPF-upgrade als gevolg van het configureren van de beheerder mist de hostvermelding
Probleem
Wanneer de RCM (Redundancy Configuration Manager)-controller een geplande UPF (User Plane Function)-overschakeling van UPF 1 (Active) naar UPF 2 (Standby) initieert, wordt verwacht dat configurator zowel UPF 1 als UPF 2 in zijn hostlijst heeft. Maar om de een of andere reden heeft configurmgr de Active UPF 1 niet in zijn actieve hostlijst, in tegenspraak met host list.on controller
En als RCM in zo'n situatie de overstap maakt van UPF 1 naar UPF 2, wordt het switchover-proces gestart. Tijdens switchover proces probeert configurmgr de Active UPF 1 host details te vinden in zijn host lijst, maar niet te vinden.
UPF switchover proces mislukt met reden "Old Active verhuisd van PendingStandby naar Active vanwege time-out bij ontvangst van stand-by status (geplande switchover)" en UPF1 wordt verplaatst van PendingStandby naar Active en UPF 2 van PendingActive naar stand-by.
//Hoe switchover-fout te detecteren is te wijten aan het configureren van ontbrekende hostgegevens in de hostlijst
In de RCM tac dbg die dergelijke tijden van switchover mislukking behandelt, zoek loggebeurtenis in het configurmgr pod log.
2024/01/12 09:08:26.878 rcm-configurmgr [DEBUG] [shclient.go:980] [rcm_grpc_ep.msg-process.int] [RcmGenTrap]: SNMP Trap verhoogd: (SwitchoverFailure) - Switchover van 10.248.187.151:22 naar 10.2 8.187.153:22 in groep:1 Mislukt! Reden: actief niet gevonden
Als rcm tac dbg NIET aanwezig is, kunt u ook bevestigen dat de UPF-overschakeling mislukt vanwege dit probleem door te zoeken naar snmp trap van RCM controller ops-center.
a) Aanmelden bij actief RCM ops-center
b) Uitvoeren commando rcm show-snmp-trap geschiedenis
c) Kijk in de snmp traps val aanwezig
SwitchoverFailure 2024-01-18T05:19:45.Z 2024-01-18T05:19:45.Z rcm-configurmgr Switchover van 10.244.127.23:22 naar 10.244.127.29:22 in groep:1 1 Reden: actief niet gevonden
Oplossing
Tot de definitieve oplossing wordt geleverd via Cisco bug-id CSCwi70133 Het werk rondom is om de configurmgr pod van de overeenkomstige AIO (All In One) K8s master node te verwijderen, met behulp van kubectl delete <configurmgr-pod-name> -n <k8-name-space>
Voorbeeld:
1. Als onderdeel van de pre-controles van de UPF upgrade automatisering werkstroom, kunnen controles om de controller te vergelijken en te configureren hostlijst worden uitgevoerd. Als een host ontbreekt in configurmgr host lijst, kan configurmgr pod delete worden gedaan zodat configurmgr volledige hosts lijst vers van controller krijgt.
2. Als de UPF-overschakeling handmatig wordt gegeven, verzamelt u 2 CLI-opdrachten van actieve RCM en vergelijkt u deze om na te gaan of er een host (Active/Standby) ontbreekt in de configuratie-hostuitvoer. Als een host ontbreekt, probleem configurmgr pod verwijderen van RCM AIO K8s master node & opnieuw controleren van de controller en configurmgr host lijst. Als de hosts overeenkomen met controller en configurmgr, gaat u verder met de handmatige overschakeling van UPF's van controller.
a) controller voor rcm-statistieken
b) rcm show-statistics configurmgr