Beobachtet, ein oder mehrere Prozesse wurden in den Hold-Down-Zustand versetzt.
ICSeverity
3 - Fehler
Auswirkungen
Aufgrund dieses Problems funktionierte der Prozess nicht mehr, was sich auf die Services auswirken könnte.
Beschreibung
Process Manager (PMAN) ist eine kritische Komponente von Cisco IOS, die den Lebenszyklus aller auf dem Gerät ausgeführten Softwareprozesse überwacht und verwaltet. Sie stellt sicher, dass wichtige Prozesse reibungslos ablaufen und korrigiert sie, wenn dies nicht der Fall ist. Diese Syslog-Meldung zeigt an, dass PMAN ein Problem mit einem Prozess erkannt hat, der nicht mehr richtig funktioniert. Der Prozess wurde zu oft mit wiederholten Fehlern neu gestartet und in den "Hold-Down"-Zustand versetzt. Es kann sich zeigen, wenn ein hartes IM (Interface Module) OIR (Online Insertion and Removal), IM Pull Out oder weiches IM OIR bewirkt, dass der Prozess ordnungsgemäß vom Kernel beendet wird. Wenn ein Prozess abstürzt oder unerwartet beendet wird, versucht PMAN normalerweise, ihn neu zu starten. Wenn der Prozess jedoch wiederholt abstürzt oder beim Neustart auf kontinuierliche Fehler stößt, erkennt PMAN dieses Muster als eine potenziell instabile Situation für das Gerät. Um zu verhindern, dass ein Prozess in einen Crash-Loop eintritt, der die Leistung und Stabilität des Systems erheblich beeinträchtigen könnte, versetzt PMAN den Prozess in einen "Hold-Down"-Zustand. Das bedeutet, dass der Prozess für einen bestimmten Zeitraum oder bis zum Eingreifen eines Administrators nicht neu gestartet wird. Der Niederhaltezustand ist ein Schutzmechanismus. Durch die Vermeidung eines sofortigen Neustarts eines fehlerhaften Prozesses bietet PMAN Systemadministratoren die Möglichkeit, das Problem ohne die Komplikation wiederholter Prozessabstürze zu diagnostizieren. Dieser Zustand ermöglicht auch, dass das übrige System mit möglichst wenig Unterbrechungen weiterarbeitet.
SyslogMeldung
PMAN-3-PROCHOLDDOWN
MessageSample
Nov 05 08:45:28 <> : %PMAN-3-PROCHOLDDOWN: Fx: pman.sh: The process cpp_ha_top_level_server has been helddown (rc xx)%
Produktfamilie
- Switches der Cisco Catalyst 9200-Serie
- Switches der Cisco Catalyst 9300-Serie
- Switches der Cisco Catalyst 9400-Serie
- Switches der Cisco Catalyst 9500-Serie
- Switches der Cisco Catalyst 9600-Serie
- Cisco Integrated Services Router der Serie 4000
- Cisco Catalyst Switches der Serie 3850
- Cisco Catalyst Switches der Serie 3650
- Cisco Aggregation Services Router der Serie ASR 1000
- Cisco Aggregation Services Router der Serie ASR 900
- Wireless Controller der Cisco Catalyst 9800-Serie
Regex
–
Empfehlung
Wenn Sie auf diese PMAN-Syslog-Meldung stoßen, weist dies darauf hin, dass möglicherweise ein tiefer gehendes Problem vorliegt, entweder mit dem Softwareprozess selbst, der Hardware, mit der er verbunden ist, oder möglicherweise sogar mit dem Software-Image des Systems. Um dieses Problem zu beheben, gehen Sie in der Regel wie folgt vor: 1. Untersuchen Sie die Protokolle, um den Kontext der Abstürze zu verstehen, können Sie diese Dateien je nach der spezifischen Plattform sammeln, wie in den Links unten zu sehen: https://www.cisco.com/c/en/us/support/docs/switches/catalyst-9200-series-switches/216945-outputs-to-collect-in-the-event-of-crash.pdf https://www.cisco.com/c/en/us/support/docs/universal-gateways-access-servers/90-series-customer-premises-equipment/7900-crashes-router-troubleshooting.html https://www.cisco.com/c/en/us/support/docs/ip/trivial-file-transfer-protocol-tftp/217967-capture-information-from-the-crashinfo-f.html 2. Führen Sie Diagnosebefehle aus, und überwachen Sie das System, um weitere Informationen zu erfassen. Router#show logging Router#show processes cpu sorted Router#show process memory sorted Router#show process cpu platform sorted 3. Überprüfen Sie, ob bekannte Fehler oder Probleme im Zusammenhang mit dem Prozess oder der verwendeten IOS-Version bekannt sind. Ziehen Sie ein geplantes Upgrade in Betracht, um Ihre Systemsoftware auf dem neuesten, von Cisco empfohlenen Stand zu halten, da Softwareupdates bekannte Fehler beheben können, die zu Prozessabstürzen führen können. https://software.cisco.com/download/home
Befehle
#show version
#show logging
#show platform
#show module
#show process cpu platform sorted
#show platform resources
#show processes memory platform sorted
#show clock
#show redundancy switchover history
#show process memory sorted
#show process memory platform accounting
#show hw-module all fpd
#show clock
#show inventory
#show facility-alarm status
#show process cpu history