In diesem Dokument werden die Ursachen für häufige Fehlermeldungen im Zusammenhang mit Cisco Express Forwarding (ehemals CEF) auf Plattformen beschrieben, auf denen Distributed Cisco Express Forwarding (ehemals dCEF) Switching (Cisco Router der Serie 7500 und Cisco Internet Router der Serie 12000) ausgeführt wird, sowie die Behebung von Fehlern.
Hinweis: Abhängig von der Plattform, auf der die verteilte Cisco Express-Weiterleitung konfiguriert ist, werden Routingprozessoren (RPs) und Line Cards (LCs) unterschiedlich bezeichnet. Für die 7500-Serie wird der RP als Route Switch Processor (RSP) und LCs als Versatile Interface Processors (VIPs) bezeichnet. Bei der Serie 12000 wird der RP als Gigabit Route Processor (GRP) bezeichnet, und LCs werden einfach als LCs bezeichnet.
Für dieses Dokument bestehen keine speziellen Anforderungen.
Dieses Dokument ist nicht auf bestimmte Software- und Hardwareversionen beschränkt.
Weitere Informationen zu Dokumentkonventionen finden Sie unter Cisco Technical Tips Conventions (Technische Tipps zu Konventionen von Cisco).
Cisco Express Forwarding Switching ist eine proprietäre Form von skalierbarem Switching, das die Probleme im Zusammenhang mit der Nachfragezwischenspeicherung behebt. Bei Cisco Express Forwarding Switching werden die Informationen, die normalerweise in einem Route-Cache gespeichert werden, auf mehrere Datenstrukturen aufgeteilt. Der Cisco Express Forwarding-Code ist in der Lage, diese Datenstrukturen im RP sowie in Slave-Prozessoren wie VIPs der Cisco Serie 7500 und LCs der Cisco Serie 12000 beizubehalten. Zu den Datenstrukturen, die eine optimierte Suche für eine effiziente Paketweiterleitung ermöglichen, gehören:
Forwarding Information Base (FIB)-Tabelle - Cisco Express Forwarding verwendet eine FIB, um präfixbasierte Switching-Entscheidungen für IP-Adressen zu treffen. Die FIB ähnelt prinzipiell einer Routing-Tabelle oder Informationsdatenbank. Es erhält ein Spiegelbild der Weiterleitungsinformationen in der IP-Routing-Tabelle. Wenn im Netzwerk Routing- oder Topologieänderungen auftreten, wird die IP-Routing-Tabelle aktualisiert, und diese Änderungen werden in der FIB übernommen. Die FIB speichert Informationen zu Next-Hop-Adressen basierend auf den Informationen in der IP-Routing-Tabelle.
Da zwischen FIB-Einträgen und Routing-Tabelleneinträgen eine Eins-zu-Eins-Korrelation besteht, enthält die FIB alle bekannten Routen und macht eine Routecache-Wartung für Switching-Pfade wie schnelles Switching und optimales Switching überflüssig.
Adjacency-Tabelle - Knoten im Netzwerk werden als angrenzend bezeichnet, wenn sie sich über eine Verbindungsschicht mit einem Hop erreichen können. Zusätzlich zur FIB verwendet Cisco Express Forwarding Adjacency-Tabellen, um den Adressinformationen der Layer 2 (L2) vorzugehen. Die Adjacency-Tabelle enthält L2-Next-Hop-Adressen für alle FIB-Einträge.
Cisco Express Forwarding kann in einem von zwei Modi aktiviert werden:
Zentraler Cisco Express Forwarding-Modus - Wenn der Cisco Express Forwarding-Modus aktiviert ist, befinden sich die Cisco Express Forwarding FIB- und Adjacency-Tabellen im RP, und der RP übernimmt die Express Forwarding. Sie können den Cisco Express Forwarding-Modus verwenden, wenn LCs für Cisco Express Forwarding Switching nicht verfügbar sind oder wenn Sie Funktionen verwenden müssen, die nicht mit dem Distributed Cisco Express Forwarding Switching kompatibel sind.
Distributed Cisco Express Forwarding-Modus - Wenn Distributed Cisco Express Forwarding aktiviert ist, unterhalten LCs (z. B. VIP LCs oder Gigabit Switch Router (GSR) LCs) identische Kopien der FIB- und Adjacency-Tabellen. Die LCs können die Expressweiterleitung selbst durchführen, wodurch der Hauptprozessor (GRP oder RSP) von der Beteiligung am Switching-Betrieb entlastet wird. Dies ist die einzige Switching-Methode, die für die Serie 12000 verfügbar ist.
Die verteilte Cisco Express Forwarding verwendet einen IPC-Mechanismus (Inter-Process Communication), um die Synchronisierung von FIBs und Adjacency-Tabellen auf dem RP und den LCs sicherzustellen.
Hinweis: In den folgenden Beispielen verwenden einige Befehle Ausgabemodifizierer (dargestellt durch die | Symbol), um die Anzeige zu vereinfachen, sodass nur die benötigten Informationen angezeigt werden. Ausgabemodifizierer werden von der Cisco IOS® Softwareversion 12.0 und höher unterstützt. Wenn Sie eine ältere Version ausführen, geben Sie den Hauptbefehl (den Befehl vor dem | Symbol) und suchen Sie in der vollständigen Ausgabe nach den entsprechenden Zeilen.
Mit dem Befehl show cef linecard können Sie auf einfache Weise überprüfen, für welches VIP- oder LC Cisco Express Forwarding deaktiviert wurde:
Bei der Serie 7500:
Router#show cef linecard CEF linecard generic information: Slot MsgSent Seq MaxSeq LowQ MedQ HighQ Flags 4 8 6 30 0 0 0 up 5 8 6 30 0 0 0 up Default-table CEF table, version 13, 11 routes Slot CEF-ver CEF-XDR Interface Flags 4 12 5 5 Active, sync 5 12 5 2 Active, sync
Bei der Serie 12000:
Router#show cef linecard CEF table version 694517, 95239 routes Slot CEF-ver MsgSent XdrSent Seq MaxSeq LowQ MedQ HighQ Flags 0 32128 365 33320 362 367 0 0 0 disabled 1 95821 1010 99369 1006 1025 0 0 0 disabled 2 92559 971 6033 967 984 0 0 0 disabled 8 62514 653 65734 649 661 0 0 0 disabled 9 47165 486 48428 483 498 0 0 0 disabled 10 79887 834 83232 830 849 0 0 0 disabled
Da die Serie 12000 nur die verteilte Cisco Express-Weiterleitung unterstützt, wird ein deaktivierter Status zur Deaktivierung des gesamten LCs führen.
Um die folgenden Fehlermeldungen zu verstehen, müssen Sie verstehen, was die XDR-Meldungen sind und wofür sie verwendet werden:
%FIB-3-NORPXDRQELEMENTE
%FIB-3-FIBBADXDRLEN
%FIB-4-FIBXDRLEN
Hier finden Sie einen Überblick über die XDR-Architektur:
Wie im Abschnitt Hintergrundinformationen dieses Dokuments erläutert, übertragen IPC-Nachrichten die FIB- und Adjacency-Tabellen vom RP zu den LCs. Mit anderen Worten, der IPC-Mechanismus synchronisiert beide Tabellensätze auf dem RP und den LCs. Jede von einer Funktion verwendete Datenstruktur muss über die FIB IPC an den LC übertragen werden, und die Statistiken müssen an den RP zurückgesendet werden. Wenn Distributed Cisco Express Forwarding aktiviert ist, trifft der LC die Weiterleitungsentscheidung unter Verwendung der lokal gespeicherten, replizierten Datenbanken.
XDR wird als IPC-Overlay-Mechanismus bezeichnet. XDR-Nachrichten werden ausschließlich bei der Implementierung von Distributed Cisco Express Forwarding verwendet.
Statistiken sowie Datenstrukturen zur Unterstützung einer Cisco IOS Software-Funktion werden in XDR-Nachrichten über den IPC-Mechanismus der Cisco IOS Software zwischen dem RP und den LCs übertragen. Insbesondere enthalten XDR-Nachrichten drei Informationssätze, die in der folgenden Tabelle aufgeführt sind:
Nachrichtentyp | Beschreibung der Nachricht | Richtung |
---|---|---|
Kontrolle | Der RP sendet Steuerungsdaten in RP-Funktions-Sub-Blöcken, die an alle gespiegelten Sub-Blöcke der LCs gesendet werden, die über Änderungen informiert werden müssen. | RP zu LC |
Statistiken | LCs sammeln Statistikinformationen aus den verschiedenen Funktionsunterblöcken, platzieren die gesammelten Informationen in einem XDR-Puffer und senden eine XDR-Nachricht an den RP. Der RP aggregiert diese Statistiken. | LC zu RP |
Asynchrones Ereignisberichte | LCs melden nicht routinemäßige Ereignisse über asynchrone Meldungen, die bei Auftreten der Bedingung gesendet werden. | LC zu RP |
Geben Sie den Befehl show cef line internal ein, um Informationen anzuzeigen, die über XDR-Nachrichten übertragen wurden. Ein Update von Network Descriptor Block (NDB)/Routing Descriptor Block (RDB) ist ein Beispiel für eine XDR.
Total elements queued: prefix 1877106 adjacency 6011 interface 4084 address 4010 policy routing 3 hw interface 84 state 6 resequence 2 control 24 time 308 subblock 18109 flow features deactivate 3 flow cache config 3 flow export config 3 flow sampling config 3 access-list 213 mpls ttl propogate 3 routemap config 126 mpls stats aggregate 3 dot1q vlan 10109 icmp limit 3
Dieser Abschnitt listet Fehlermeldungen auf, die in den Routerprotokollen angezeigt werden, und enthält Tipps zur Fehlerbehebung.
Diese Fehlermeldungen werden in den Routerprotokollen (geben Sie den Befehl show logging exec auf Ihrem Router aus, oder konsultieren Sie den Syslog-Server, wenn Sie einen verwenden) wie folgt:
Bei der Serie 7500:
Dec 19 17:58:56 CET: %FIB-3-FIBDISABLE: Fatal error, slot 0: no memory DEC 19 17:58:58 CET: %IPC-5-SLAVELOG: VIP-SLOT0: 00:03:37: %SYS-2-MALLOCFAIL: Memory allocation of 65524 bytes failed from 0x6009E9E4, pool Processor, alignment 16 -Process= "CEF IPC Background", ipl= 0, pid= 7 -Traceback= 600A141C 600A2B78 6009E9EC 6009F350 60235A34 60221BA4 60225528 6022A46C 60231104 6022FAC4 6022FCCC 6022FDBC 60230334 6009BB74 6009BB60 DEC 19 17:59:06 CET: %FIB-3-FIBDISABLE: Fatal error, slot 9: no memory DEC 19 17:59:11 CET: %IPC-5-SLAVELOG: VIP-SLOT9: 00:03:47: %SYS-2-MALLOCFAIL: Memory allocation of 65524 bytes failed from 0x6009E9E4, pool Processor, alignment 16 -Process= "CEF IPC Background", ipl= 0, pid= 7 -Traceback= 600A141C 600A2B78 6009E9EC 6009F350 60235A34 60221BA4 60225528 6022A46C 60231104 6022FAC4 6022FCCC 6022FDBC 60230334 6009BB74 6009BB60 DEC 19 17:59:31 CET: %IPC-5-SLAVELOG: VIP-SLOT8: 00:04:11: %SYS-2-MALLOCFAIL: Memory allocation of 3956 bytes failed from 0x602835F0, pool Processor, alignment 32 -Process= "CEF LC Stats", ipl= 0, pid= 21 -Traceback= 600A141C 600A2EC8 602835F8 60283C84 60283C58 60283CE4 60230574 6009BB74 6009BB60 DEC 19 17:59:38 CET: %FIB-3-FIBDISABLE: Fatal error, slot 8: no memory DEC 19 18:00:29 CET: %FIB-3-FIBDISABLE: Fatal error, slot 10: no memory ...
Auf der 7500-Serie wird die Fehlermeldung angezeigt, die unmittelbar nach %IPC-5-SLAVELOG angezeigt wird: Die VIP-SLOT-Nachricht wird direkt vom VIP gesendet, das sich unter Verwendung eines IPC-Mechanismus im angegebenen Steckplatz befindet. In diesem speziellen Beispiel stammt die Nachricht %SYS-2-MALLOCFAIL von der VIP-Karte.
Jun 27 04:58:56 CET: %FIB-3-FIBDISABLE: Fatal error, slot 1: no memory Jun 27 04:59:07 CET: %FIB-3-FIBDISABLE: Fatal error, slot 2: no memory Jun 27 04:59:36 CET: %FIB-3-FIBDISABLE: Fatal error, slot 4: no memory Jun 27 04:59:45 CET: %FIB-3-FIBDISABLE: Fatal error, slot 0: no memory SLOT 2:Jun 27 04:23:00: %SYS-2-MALLOCFAIL: Memory allocation of 65524 bytes failed from 0x4009D9E4, pool Processor, alignment 32 -Process= "CEF IPC Background", ipl= 0, pid= 38 -Traceback= 400A0BFC 400A2358 4009D9EC 4009E338 403168BC 40316B68 40316EBC 4031C318 40321234 4032858C 40326CD4 40326EF4 40326FE4 403275CC 4009BC74 4009BC60 SLOT 2:Jun 27 04:23:00: %FIB-3-NOMEM: Malloc Failure, disabling DCEF on linecard ...
Hinweis: Meldungen, die mit "SLOT #:" beginnen, werden vom LC selbst generiert.
Diese Meldungen weisen darauf hin, dass die verteilte Cisco Express Forwarding im VIP (für die Serie 7500) oder LC (für die Serie 12000) deaktiviert wurde, da nicht genügend Speicher vorhanden war, um die Cisco Express Forwarding-FIB und die Adjacency-Tabellen von der Hauptplatine herunterzuladen. Da die Serie 12000 nur verteiltes Cisco Express Forwarding-Switching unterstützt, wird bei Deaktivierung von Distributed Cisco Express Forwarding auch die Karte deaktiviert.
Bei der Ausführung vollständiger Internet Border Gateway Protocol (BGP)-Routen wird empfohlen, mindestens 128 MB auf dem VIP oder LC bereitzustellen.
Da das VIP2-40 der 7500-Serie nur maximal 64 MB groß sein kann, wird ein Upgrade auf VIP2-50 oder sogar VIP4-80 empfohlen, wenn Sie Distributed Cisco Express Forwarding mit vollständigen Internet-BGP-Routen verwenden möchten. 32 MB sind definitiv nicht ausreichend für die Ausführung der verteilten Cisco Express Forwarding.
Je nach Größe der Routing-Tabelle wird ein VIP2-50 oder höher mit mindestens 128 MB Arbeitsspeicher empfohlen.
Wenn Ihr Router die vollständige Internet-Routing-Tabelle akzeptiert (oder in der Nähe dieser Tabelle), benötigt BGP vorübergehend während der Konvergenzphase eine große Speicherkapazität, nachdem ein Router neu geladen oder der Status einer BGP-Verbindung geändert wurde. Während dieser Konvergenz kann der Speicherpool des Prozessors einen sehr niedrigen Wert erreichen, was sich in der Ausgabe des Befehls show memory summary widerspiegelt. Während der kurzen Phase mit geringem Speicher können andere Prozesse betroffen sein, wenn sie Speicher benötigen. Wenn Sie beispielsweise den telnet-Befehl ausgeben, um einen Router zu kontaktieren, ist Speicher erforderlich, um die TCP-Sitzung aufrechtzuerhalten.
Ein weiterer vorübergehender Benutzer von Prozessorspeicher ist das Label Distribution Protocol (LDP) in MPLS-Netzwerken (Multiprotocol Label Switching).
Cisco Express Forwarding verursacht den FIBDISABLE-Fehler nur dann, wenn dem Router der Prozessorspeicher vollständig ausgeht. Für FIBDISABLE gibt es keine Tiefwasserkennzeichnung. Wenn sich Cisco Express Forwarding deaktiviert hat, wird der gesamte Arbeitsspeicher freigegeben. Das Erfassen der Ausgabe des Befehls show memory summary nach der Deaktivierung zeigt, dass genügend freier Speicher verfügbar ist, aber diese Ausgabe ist irreführend. Nur die Erfassung des Befehls show memory summary, bevor Cisco Express Forwarding die Deaktivierung der Funktion "Low Memory" (Zusammenfassung des Speichers anzeigen) aufruft, werden Daten über den Zustand des niedrigen Speichers angezeigt.
Darüber hinaus kann eine FIBDISABLE-Bedingung eine Nebenwirkung sein, wenn keine IPC-Puffer verfügbar sind. Die Cisco IOS Software weist nicht dynamisch mehr IPC-Puffer zu, wenn sie benötigt werden. Wenn keine IPC-Puffer vorhanden sind, werden keine FIB NOMEM-Fehlermeldungen generiert, es können jedoch andere IPC-Fehlermeldungen wie IPC-3-NOBUFF angezeigt werden. Das Auslaufen von IPC-Puffern verursacht keinen FIBDISABLE-Fehler. Cisco Express Forwarding erfordert lediglich eine fehlgeschlagene Nachricht und versucht es zu einem späteren Zeitpunkt erneut. Wenn die IPC-Puffer jedoch erschöpft sind und Cisco Express Forwarding keinen IPC-Puffer abrufen kann, können Nachrichten an LCs in Warteschlangen gestellt werden, bis der Arbeitsspeicher schließlich ausgeht.
Eine häufige Frage an das Cisco Technical Assistance Center (TAC) lautet, wie ein mit dem BGP verbundener Router geplant oder bestimmt werden kann, ob er über genügend Arbeitsspeicher für die Ausführung des BGP verfügt. Die Antwort hängt von der Konfiguration ab. Hier einige Überlegungen:
Planen Sie die Verwendung von iBGP (Internal Border Gateway Protocol)- und eBGP-Peers (External Border Gateway Protocol)? Wie viele Peers? BGP-Peer-Gruppen können helfen. Mehr Peers bedeuten eine längere Konvergenzzeit.
Wie viele Routen werden für jeden Peer in jede Richtung ausgetauscht? Stellen Sie sicher, dass Routen und Pfade ordnungsgemäß voneinander getrennt werden. Routen zählen die Anzahl der Präfixe in der BGP-Routing-Informationsbasis. Pfade zählen die Anzahl der BGP-Präfixe, die einem benachbarten Peer mitgeteilt werden. Wenn beispielsweise fünf BGP-Peers die vollständige Routing-Tabelle senden, sendet jeder Peer die gleichen Routen. Wenn sich die Routen der Peers zu 90 Prozent überschneiden, verfügt der empfangende Router über eine Routing-Tabelle mit etwa 150.000 Routen und fünf Pfaden für die meisten Routen.
Weitere zu berücksichtigende Faktoren:
Die Serie 12000 verfügt über eine LC-Engine.
Die Anzahl der IGP-Routen (Interior Gateway Protocol).
Die Anzahl der Adjacencies.
Load Balancing: Die Anzahl der Pfade zum gleichen Ziel.
Verwendung von MPLS Virtual Private Network (VPN) und der Anzahl der VRF-Instanzen (Virtual Routing and Forwarding) sowie der Anzahl der Routen pro VRF.
Die Cisco IOS Software-Version 12.0(18)S und spätere Versionen erfordern offiziell 128 MB auf allen LCs. Da neuere Versionen der Cisco IOS-Software mehr Prozessorspeicher belegen, wird empfohlen, bis zu 256 MB für die zukünftige Skalierbarkeit von Routern zu verwenden, die die vollständige Internet-Routing-Tabelle akzeptieren. Zuvor war die Serie 1200 mit 64 MB auf LCs verfügbar. Solche LCs sollten aktualisiert werden.
Prüfen Sie, welche Karten betroffen sind (siehe Abschnitt "Verifying Cisco Express Forwarding Status on VIPs and LCs" in diesem Dokument), und geben Sie die folgenden Befehle ein, um die verschiedenen Karten in Ihrem Router und deren Speichergröße anzuzeigen:
Bei der Serie 7500:
Router#show diag | i (Slot | controller) Slot 0: EIP controller, HW rev 1.05, board revision B0 Slot database information: Slot 2: Slot 3: Slot 4: VIP2 controller, HW rev 2.11, board revision E0 Slot database information: Controller Memory Size: 64 MBytes DRAM, 2048 KBytes SRAM Slot 5: VIP2 R5K controller, HW rev 2.03, board revision A0 Slot database information: Controller Memory Size: 128 Mbytes DRAM, 8192 Kbytes SRAM Slot 31 (virtual):
Bei der Serie 12000:
Router#show diag | i (DRAM|SLOT) SLOT 0 (RP/LC 0 ): 1 Port SONET based SRP OC-12c/STM-4 Single Mode DRAM size: 268435456 bytes FrFab SDRAM size: 134217728 bytes, SDRAM pagesize: 8192 bytes ToFab SDRAM size: 134217728 bytes, SDRAM pagesize: 8192 bytes SLOT 2 (RP/LC 2 ): 12 Port Packet over E3 DRAM size: 67108864 bytes FrFab SDRAM size: 67108864 bytes ToFab SDRAM size: 67108864 bytes SLOT 3 (RP/LC 3 ): 1 Port Gigabit Ethernet DRAM size: 134217728 bytes FrFab SDRAM size: 134217728 bytes, SDRAM pagesize: 8192 bytes ToFab SDRAM size: 134217728 bytes, SDRAM pagesize: 8192 bytes SLOT 5 (RP/LC 5 ): Route Processor DRAM size: 268435456 bytes
Wenn den betroffenen Karten mehr Speicher hinzugefügt wird, sollten die Nachrichten vermieden und die verteilte Cisco Express-Weiterleitung auf den Karten wieder aktiviert werden. Wenn die Nachrichten auch nach einem Speicherupgrade noch vorhanden sind, wenden Sie sich an Ihren Cisco Support-Mitarbeiter, und geben Sie die gesammelten Informationen zusammen mit der Ausgabe eines show tech-support-Befehls an.
Hinweis: Die alten Fast Ethernet Interface Processor (FEIP)-Modelle (CX-FEIP2-2TX und CX-FEIP2-2TX) unterstützen kein verteiltes Switching und erzeugen ähnliche Meldungen, wenn Sie versuchen, die verteilte Cisco Express-Weiterleitung zu aktivieren. Geben Sie den Befehl show diag [slot#] ein, um festzustellen, ob Ihr Motherboard ein VIP- oder ein FEIP-Motherboard ist:
Router#show diag 0 Slot 0: Physical slot 0, ~physical slot 0xF, logical slot 0, CBus 0 Microcode Status 0x4 Master Enable, LED, WCS Loaded Pending I/O Status: None EEPROM format version 1 FEIP controller, HW rev 2.01, board revision B0 Serial number: 03696620 Part number: 73-1374-04 Test history: 0x0E RMA number: 203-11-48 Flags: cisco 7000 board; 7500 compatible
Wenn Sie Distributed Cisco Express Forwarding ausführen möchten, müssen Sie Ihre alte FEIP durch eine VIP-Karte durch Fast Ethernet-Port-Adapter ersetzen.
Die folgenden Meldungen (auf den Serien 7500 und 12000) weisen auch darauf hin, dass die Cisco Express Forwarding deaktiviert wurde, dieses Mal, weil der RSP oder GRP keinen Keepalive vom VIP oder LC erhalten hat:
DEC 19 18:03:55 CET: %FIB-3-FIBDISABLE: Fatal error, slot 0: No window message, LC to RP IPC is non-operational DEC 19 18:04:05 CET: %FIB-3-FIBDISABLE: Fatal error, slot 9: No window message, LC to RP IPC is non-operational DEC 19 18:04:37 CET: %FIB-3-FIBDISABLE: Fatal error, slot 8: No window message, LC to RP IPC is non-operational DEC 19 18:05:28 CET: %FIB-3-FIBDISABLE: Fatal error, slot 10: No window message, LC to RP IPC is non-operational DEC 19 18:05:59 CET: %FIB-3-FIBDISABLE: Fatal error, slot 2: No window message, LC to RP IPC is non-operational DEC 19 18:06:07 CET: %FIB-3-FIBDISABLE: Fatal error, slot 1: No window message, LC to RP IPC is non-operational
Überprüfen Sie zunächst, ob genügend Speicher auf Ihren Karten vorhanden ist.
Überprüfen Sie anschließend die CPU-Auslastung auf Ihrem VIP oder LC (geben Sie den Befehl show controller vip [slot#] proc cpu auf der 7500-Serie aus, und der Befehl execute-on slot 0 zeigt proc CPU auf der 12000-Serie). Wenn die CPU-Auslastung wirklich hoch ist (über 95 %), ist das VIP oder LC möglicherweise zu beschäftigt, um die Keepalives an den RSP oder GRP zu senden. Die Ursache des Problems ist die hohe CPU-Auslastung. Tipps zur Fehlerbehebung finden Sie unter Fehlerbehebung bei hoher CPU-Auslastung auf Cisco Routern.
Wenn alles in Ordnung ist, werden die Fehlermeldungen höchstwahrscheinlich durch einen Fehler in der Cisco IOS Software verursacht.
Bei der Fehlerbehebung sollten Sie zuerst die betroffenen Karten überprüfen (siehe Abschnitt "Verifying Cisco Express Forwarding Status on VIPs and LCs" in diesem Dokument). Sie können versuchen, Cisco Express Forwarding auf diesen Karten neu zu starten, indem Sie den Befehl clear cef linecard [slot#] eingeben. Bei der 7500-Serie kann es auch erforderlich sein, die VIP-Karte zurückzusetzen, indem der Befehl Microcode reload (Neuladen) ausgeführt wird. Dadurch wird ein CBUS-Komplex generiert, der eine Datenverkehrsunterbrechung von ca. zwei Minuten verursacht (siehe What Causes a "%RSP-3-RESTART: cbus komplex"? für weitere Informationen). Dieses Verfahren sollte zumindest vorübergehend die verteilte Cisco Express Forwarding auf dem VIP oder LC wiederherstellen.
Andernfalls können Sie durch ein Upgrade auf die neueste Version Ihres Release-Train der Cisco IOS Software alle behobenen Probleme beseitigen, die zu diesem Fehler führen. Sollte das Problem auch nach dem Upgrade weiterhin auftreten, wenden Sie sich an Ihren Cisco Support-Mitarbeiter, und geben Sie zusammen mit der Ausgabe des Befehls show tech-support die gesammelten Informationen an.
Die folgenden Fehlermeldungen sind allgemeiner und können dazu führen, dass andere Fehlermeldungen angezeigt werden (z. B. %FIB-3-FIBDISABLE: Schwerer Fehler, Steckplatz [#]: Keine Meldung im Fenster, LC an RP IPC ist nicht betriebsbereit):
%FIB-3-FIBDISABLE: Fatal error, slot 3: IPC failure %FIB-3-FIBDISABLE: Fatal error, slot 0: IPC failure %FIB-3-FIBDISABLE: Fatal error, slot 1: IPC failure %FIB-3-FIBDISABLE: Fatal error, slot 2: IPC failure %FIB-3-FIBDISABLE: Fatal error, slot 4: IPC failure %FIB-3-FIBDISABLE: Fatal error, slot 9: IPC failure %FIB-3-FIBDISABLE: Fatal error, slot 10: IPC failure
IPC (Inter-Process Communication) ist ein Protokoll, das vom Hauptprozessor (RSP oder GRP) und vom VIP oder LC für die Kommunikation verwendet wird. Sie stellt die Synchronisierung von FIBs und Adjacency-Tabellen sicher, wenn die verteilte Cisco Express-Weiterleitung ausgeführt wird. Es gibt mehrere Ursachen für diese IPC-Fehlermeldungen, z. B.:
Die folgenden Befehle können zur Analyse des tatsächlichen IPC-Status verwendet werden. Die Ausgabe für diese Befehle unterscheidet sich manchmal zwischen der Serie 7500 und der Serie 12000.
show ipc status - dient zur Überprüfung von IPC-Fehlern, NACKs und ipc_output_failure
show ipc knoten - dient zum Überprüfen der aktiven Karten.
show ipc queue - dient zum Überprüfen der IPC-Nachrichten, die auf ACK warten.
Auf der Serie 7500 werden folgende Ergebnisse ausgegeben:
Router#show ipc status IPC System Status: This processor is the IPC master server. 1000 IPC message headers in cache 1591560 messages in, 5884 out, 1587095 delivered to local port, 2757 acknowledgements received, 2764 sent, 0 NACKS received, 0 sent, 0 messages dropped on input, 276 messages dropped on output 0 no local port, 264 destination unknown, 0 no transport 0 missing callback or queue, 0 duplicate ACKs, 5 retries, 1 message timeout. 12 ipc_output failures, 0 mtu failures, 0 msg alloc failed, 0 emer MSG alloc failed, 0 no origs for RPC replies 0 pak alloc failed, 10 memd alloc failed 2 no hwq, 0 failed opens, 0 hardware errors No regular dropping of IPC output packets for test purposes Router#show ipc nodes There are 3 nodes in this IPC realm. ID Type Name Last Last Sent Heard 10000 Local IPC Master 0 0 1030000 RSP-CY RSP IPC card slot 3 7 7 1000000 RSP-CY RSP IPC card slot 0 10 10 Router#show ipc queue There are 0 IPC messages waiting for acknowledgement in the transmit queue. There are 0 IPC messages waiting for a response. There are 0 IPC messages waiting for additional fragments. There are 0 IPC messages currently on the IPC inboundQ. There are 0 messages currently in use by the system.
Bei der Serie 12000 werden folgende Ergebnisse ausgegeben:
Router#show ipc status IPC System Status: This processor is the IPC master server. 19244592 messages in, 26698 out, 19244448 delivered to local port, 102 acknowledgements received, 4780307 sent, 0 NACKS received, 0 sent, 0 messages dropped on input, 0 messages dropped on output 0 no local port, 0 destination unknown, 0 no transport 0 missing callback or queue, 0 duplicate ACKs, 0 retries, 0 message timeouts. 0 ipc_output failures, 0 mtu failures, 0 MSG alloc failed, 0 emer MSG alloc failed, 0 no origs for RPC replies 0 pak alloc failed, 0 memd alloc failed 0 no hwq, 0 failed opens, 0 hardware errors Router#show ipc nodes There are 4 nodes in this IPC realm. ID Type Name Last Last 10000 Local IPC Master 0 0 1000000 GSR GSR Slot 0 23 47 1010000 GSR GSR Slot 1 23 26 1040000 GSR GSR Slot 4 23 29 Sent Heard Router#show ipc queue There are 0 IPC messages waiting for acknowledgement in the transmit queue. There are 0 messages currently in use by the system.
Wenn die markierten Zähler zunehmen, wird IPC für die verschiedenen Steckplätze nicht ordnungsgemäß ausgeführt. In diesem Fall sollten Sie zunächst versuchen, die entsprechende LC wieder einzusetzen oder sie zurückzusetzen, indem Sie den Befehl Microcode reload (für die Serie 7500) oder den Befehl hw-module slot [slot#] reload (für die Serie 12000) ausführen. Wenn der IPC-Prozess nach dem Zurücksetzen des LC nicht wiederhergestellt wird, versuchen Sie, die Platine in einen anderen Steckplatz zu verschieben. Wenn es immer noch nicht funktioniert, ersetzen Sie das fehlerhafte VIP oder LC.
Bei einem Internet Router der Serie 12000 kann die Fabric selbst die Ursache sein. Wenn eine der Switching Fabric Cards (SFCs) fehlerhaft ist, erhalten Sie möglicherweise ähnliche Fehlermeldungen, da die IPC-Meldungen nicht mehr durch die Fabric geleitet werden können. In diesem Fall sollten Sie jedoch auch andere Meldungen sehen, die auf die fehlerhafte Fabric verweisen.
Sie können überprüfen, ob eine der SFCs fehlerhaft ist, indem Sie den Befehl show controller fia wie folgt ausführen:
Router#show controllers fia Fabric configuration: Full bandwidth redundant Master Scheduler: Slot 17 >From Fabric FIA Errors /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html --- redund fifo parity 0 redund overflow 0 cell drops 1 crc32 lkup parity 0 cell parity 0 crc32 0 Switch cards present 0x0017 Slots 16 17 18 20 Switch cards monitored 0x0017 Slots 16 17 18 20 Slot: 16 17 18 19 20 Name: csc0 csc1 sfc0 sfc1 sfc2 /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html los 0 0 0 0 0 state Off Off Off Off Off crc16 0 0 4334 0 0 To Fabric FIA Errors /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html /en/US/docs/net_mgmt/wan_service_administrator/1.1/administrator/guide/getstart.html --- sca not pres 0 req error 0 uni FIFO overflow 0 grant parity 0 multi req 0 uni FIFO undrflow 0 cntrl parity 0 uni req 0 crc32 lkup parity 0 multi FIFO 0 empty dst req 0 handshake error 0 cell parity 0
In diesem Beispiel ist sfc0 wahrscheinlich schlecht (Steckplatz 18) und muss ersetzt werden.
Wenn eine der Karten nicht ordnungsgemäß bootet, kann sie nicht mit dem Hauptprozessor (GRP oder RSP) kommunizieren. Sie können das Protokoll überprüfen, indem Sie den Befehl show log eingeben. wird angezeigt, ob beim Hochfahren etwas schief gegangen ist. Sie müssen auch den Status des LC überprüfen.
Der tatsächliche Status der LCs kann mit dem Befehl show diag überprüft werden.
Bei der Serie 7500:
Router#show diag | i (Slot|Board is) Slot 0: Board is analyzed Slot database information: Slot 2: Slot 3: Slot 4: Board is analyzed Slot database information: Slot 5: Board is analyzed Slot database information: Slot 31 (virtual)
Bei der Serie 1200:
Router#show diags | i SLOT | State SLOT 0 (RP/LC 0 ): Route Processor Board State is IOS Running (ACTV RP ) SLOT 1 (RP/LC 1 ): 1 port ATM Over SONET OC12c/STM-4c Multi Mode Board State is Line Card Enabled (IOS RUN ) SLOT 2 (RP/LC 2 ): 1 Port Gigabit Ethernet Board State is Line Card Enabled (IOS RUN ) SLOT 3 (RP/LC 3 ): 3 Port Gigabit Ethernet Board State is Line Card Enabled (IOS RUN ) SLOT 4 (RP/LC 4 ): 4 port ATM Over SONET OC-3c/STM-1 Multi Mode Board State is In Reset (IN RSET) SLOT 5 (RP/LC 5 ): 8 Port Fast Ethernet Copper Board State is Line Card Enabled (IOS RUN ) SLOT 6 (RP/LC 6 ): 4 Port Packet Over SONET OC-3c/STM-1 Multi Mode Board State is Line Card Enabled (IOS RUN ) SLOT 7 (RP/LC 7 ): 1 Port E.D. Packet Over SONET OC-48c/STM-16 Single Mode/SR SC-SC connector Board State is Line Card Enabled (IOS RUN ) SLOT 17 (CSC 1 ): Clock Scheduler Card(8) SLOT 18 (SFC 0 ): Switch Fabric Card(8) SLOT 19 (SFC 1 ): Switch Fabric Card(8) SLOT 20 (SFC 2 ): Switch Fabric Card(8) SLOT 24 (PS A1 ): AC Power Supply(8)
Der normale Status ist auf der Serie 1200 Line Card Enabled (Linecard aktiviert), und die Karte der Serie 7500 wird analysiert.
Überprüfen Sie, ob die Karte von der Cisco IOS-Software und dem Boot-Image unterstützt wird, das Sie gerade ausführen. Dazu können Sie den Software Advisor verwenden (nur registrierte Kunden). Wenn die Software normal ausgeführt wird, versuchen Sie, die entsprechende LC wieder einzusetzen, oder setzen Sie sie zurück, indem Sie den Befehl Microcode reload (für die Serie 7500) oder den Befehl hw-module module slot [slot#] reload (für die Serie 12000) ausführen.
Wenn die LC nicht wieder zum Leben erweckt wird, versuchen Sie, die Karte in einen anderen Steckplatz zu setzen, um sicherzustellen, dass dieser Steckplatz im Gehäuse nicht defekt ist. Wenn es immer noch nicht funktioniert, muss das VIP oder LC wahrscheinlich ersetzt werden.
Sie können auch prüfen, ob genügend Speicher auf dem LC vorhanden ist und ob der Speicher direkt von Cisco oder von einem von Cisco zugelassenen Anbieter erworben wurde. Ein LC bootet nicht, wenn der falsche Speichertyp verwendet wird oder nicht genügend Speicher vorhanden ist, um den Mikrocode hochzuladen.
Es kann vorkommen, dass der LC nicht über genügend Arbeitsspeicher verfügt und keine Puffer mehr für die IPC-Kommunikation bietet. In diesem Fall sollten Sie den Speicher des LC aktualisieren.
Wenn alles andere in Ordnung zu sein scheint, sollten Sie die Möglichkeit eines Fehlers in der Cisco IOS Software in Betracht ziehen. Durch ein Upgrade auf die neueste Version des Release Train der Cisco IOS Software werden alle Probleme mit fest installierten IPC-Systemen beseitigt.
In einigen seltenen Fällen, in denen eine Verbesserung der Zugriffslisten konfiguriert ist, im Zusammenhang mit der Serie 12000 erhalten Sie möglicherweise auch diese Fehlermeldungen. Eine kurzfristige Lösung besteht darin, diese neue Funktion zu deaktivieren, indem der Befehl no access-list hardware psa ausgegeben wird. Weitere Informationen finden Sie unter Leistungsverbesserungen der Zugriffslisten für Cisco 12000-Gigabit-Switch-Router.
Wenn Sie die Ursache der Meldungen nicht bestimmen können oder das Problem weiterhin in der neuesten Cisco IOS Software-Version angezeigt wird, die CCO für Ihren Release Train zur Verfügung stellt, ist möglicherweise ein neuer Fehler bei der Cisco IOS Software aufgetreten. Wenden Sie sich an Ihren Cisco Support-Mitarbeiter, und stellen Sie die von Ihnen gesammelten Daten zusammen mit der Ausgabe der show tech-support und der show cef linecard-Befehle dieses Routers bereit.
Nach einem VIP-Absturz wird der RSP-Paketspeicher (auch als MEMD bezeichnet) empfangen, und die IPC-Verbindungen zwischen dem RSP und den VIPs werden zurückgesetzt. Wenn der RSP bei einem VIP-Absturz Cisco Express Forwarding-Nachrichten in der IPC-Weiterleitungstabelle in die Warteschlange stellt, können diese Meldungen eine Zeitüberschreitung verursachen und dazu führen, dass Cisco Express Forwarding auf anderen LCs deaktiviert wird. Die Cisco Bug-ID CSCdv87489 (nur registrierte Kunden) löst dieses Problem auf dem RSP, indem sie Cisco Express Forwarding auffordert, eine OIR-, LC-Reload- oder MEMD-Aufzeichnung zu erkennen und Nachrichten in der Warteschlange für die erneute Übertragung zu leeren. Die Cisco Bug-ID CSCdu81796 (nur registrierte Kunden) löst dieses Problem auf dem Cisco Router der Serie 1000.
Wenn ein OIR eines VIP oder LC ausgeführt wird, können FIBDISABLE-Fehler auf anderen Steckplätzen auftreten. Diese Situation tritt ein, wenn Cisco Express Forwarding auf dem RP aufgrund eines OIR-Ereignisses auf einem der VIPs keine IPC-Verbindung mit anderen VIP-Karten herstellt. Cisco Bug ID CSCdv47664 (nur registrierte Kunden) löst dieses Problem.
Sie können auch die folgenden Meldungen in den Routerprotokollen bemerken:
%FIB-4-RPPREFIXINCONST2: RP missing prefix for 195.74.205.54/32 in FIB table Default-table (present in routing) %FIB-4-RPPREFIXINCONST2: RP missing prefix for 195.74.205.231/32 in FIB table Default-table (present in routing) %FIB-4-RPPREFIXINCONST2: RP missing prefix for 195.74.221.68/32 in FIB table Default-table (present in routing) %FIB-4-RPPREFIXINCONST2: RP missing prefix for 195.74.216.52/32 in FIB table Default-table (present in routing) %FIB-4-RPPREFIXINCONST2: RP missing prefix for 195.74.216.96/32 in FIB table Default-table (present in routing) %FIB-4-RPPREFIXINCONST2: RP missing prefix for 195.74.216.55/32 in FIB table Default-table (present in routing)
oder
%FIB-4-LCPREFIXINCONST2: Slot 1 missing prefix entry for 64.0.17.0/32 %FIB-4-LCPREFIXINCONST2: Slot 1 missing prefix entry for 64.0.45.0/32 %FIB-4-LCPREFIXINCONST2: Slot 1 missing prefix entry for 64.0.23.0/32
Dieses Problem betrifft die gesamte Hardware, auf der Distributed Cisco Express Forwarding ausgeführt wird, einschließlich der Serien 7500 und 12000. Diese Meldungen sind Warnungen, die von der Cisco Express Forwarding Consistency Checker generiert werden, wenn Inkonsistenzen zwischen Cisco Express Forwarding-Tabellen festgestellt werden.
Die Konsistenzprüfung verwendet verschiedene Mechanismen, um Inkonsistenzen zu finden:
Der LC oder VIP sendet dem GRP oder RSP jede Adresse, an die er keine Pakete weiterleiten konnte. Wenn der GRP oder RSP erkennt, dass es sich um einen relevanten Eintrag handelt, wurde eine Inkonsistenz erkannt und auf der Konsole eine Fehlermeldung ausgegeben.
Die LCs oder VIPs und der GRP oder RSP senden einander alle 60 Sekunden eine feste Anzahl von Präfixen (standardmäßig 100). Wenn eine Inkonsistenz festgestellt wird, wird die Fehlermeldung angezeigt.
Wenn die Inkonsistenz nicht korrigiert wird, kann dies zu unerreichbaren Zielen und Paketverlusten führen. Wenn Sie diese Meldungen sehen, müssen Sie zunächst den Befehl show ip cef auf dem in der Fehlermeldung erwähnten Gerät ausführen und überprüfen, ob das Präfix vorhanden ist. Dadurch erfahren Sie, ob der Router die Inkonsistenz selbst korrigiert hat.
Im Folgenden finden Sie ausführliche Erklärungen zu den einzelnen Nachrichten sowie Empfehlungen, wie Sie diese loswerden können.
%FIB-4-RPPREFIXINCONST2 - Eine passive Konsistenzprüfung hat ein Präfix in der Routing-Tabelle entdeckt, das in der Cisco Express Forwarding Forwarding-Tabelle auf dem RP nicht vorhanden ist. Dies kann ein vorübergehender Zustand sein.
Wenn dasselbe Präfix wiederholt Fehler ausgibt, überprüfen Sie das Präfix in Cisco Express Forwarding und in der Routing-Tabelle. Versuchen Sie, Cisco Express Forwarding zu deaktivieren oder zu aktivieren, wenn das Präfix fehlt.
%FIB-4-RPPREFIXINCONST1: Eine passive Konsistenzprüfung hat ein Präfix in der Weiterleitungstabelle des LC entdeckt, das auf dem RP nicht vorhanden ist. Dies kann ein vorübergehender Zustand sein.
Wenn dasselbe Präfix wiederholt Fehler ausgibt, überprüfen Sie das Präfix Cisco Express Forwarding auf dem RP und der Linecard. Wenn der Befehl clear cef linecard erforderlich ist, wird eine neue Cisco Express Forwarding-Tabelle auf die Linecard heruntergeladen.
%FIB-4-LCPREFIXINCONST1: Ein Paket ist auf dem LC eingegangen, aber die Suche der Ziel-IP-Adresse hat dieses Präfix nicht in der Weiterleitungstabelle gefunden. Das Präfix ist jedoch auf dem RP vorhanden. Dies kann ein vorübergehender Zustand sein.
Wenn dasselbe Präfix wiederholt Fehler ausgibt, überprüfen Sie das Präfix Cisco Express Forwarding auf dem RP und dem LC. Wenn der Befehl clear cef linecard erforderlich ist, wird eine neue Cisco Express Forwarding-Tabelle auf den LC heruntergeladen. Sie können auch versuchen, einen eindeutigen Adjacency-Befehl auszugeben, um die /32-Präfixe neu zu laden.
%FIB-4-LCPREFIXINCONST2: Eine passive Konsistenzprüfung hat ein Präfix entdeckt, das in der Weiterleitungstabelle des LC fehlt, das auf dem RP vorhanden ist. Dies kann ein vorübergehender Zustand sein.
Wenn dasselbe Präfix wiederholt Fehler ausgibt, überprüfen Sie das Präfix Cisco Express Forwarding auf dem RP und dem LC. Wenn der Befehl clear cef linecard erforderlich ist, wird eine neue Cisco Express Forwarding-Tabelle auf den LC heruntergeladen. Sie können auch versuchen, den Befehl clear adjacency auszugeben, um die /32-Präfixe neu zu laden.
Wenn die Meldung nur einmal angezeigt wurde und die Inkonsistenz sofort behoben wurde, kann es sich um ein vorübergehendes Ereignis handeln, das keine Aktion erfordert. Wenn Sie jedoch viele dieser Meldungen erhalten oder der Router diese Situation nicht selbst korrigiert, tritt wahrscheinlich ein Softwarefehler im Cisco Express Forwarding-Code auf. Einige dieser Softwarefehler wurden in den Cisco IOS Software-Versionen 12.0(17)S1 und 12.0(17)ST1 behoben. Stellen Sie daher sicher, dass Sie mindestens diese Version der Cisco IOS-Software ausführen.
Wenn das Problem nach einem Upgrade auf die neueste Version in Ihrem Release Train weiterhin auftritt, wenden Sie sich an Ihren Cisco Support-Mitarbeiter. Geben Sie dort die Ausgabe des show tech, show ip route und die show ip cef-Befehle an.
Hinweis: Sie können die Konsistenzprüfungen ausschalten, indem Sie den globalen Konfigurationsbefehl no ip cef table consistency-check eingeben.
Weitere Informationen und Tipps zur Fehlerbehebung zu dieser Fehlermeldung finden Sie unter Troubleshooting Prefix Inkonsistencies with Cisco Express Forwarding.
Hinweis: Lesen Sie den Abschnitt External Data Representation (XDR) Overview (Übersicht über externe Datendarstellung) dieses Dokuments, um die Erklärungen und Empfehlungen für diese Fehlermeldung besser zu verstehen.
Während der RP gerade eine Nachricht an die LCs im System bereitstellte, war die Bereitstellung von Warteschlangenelementen für die Einreihung der Nachrichten zur Übertragung erschöpft.
Bei der Cisco Serie 12000 kann die verteilte Cisco Express-Weiterleitung aufgrund des Speicherbedarfs während einer großen Routing-Aktualisierung (z. B. beim Hochfahren) deaktiviert werden. Beispielsweise kann ein RP beim Routing-Flaps und Neustart Malloc-Fehler verursachen, die das Switching von Distributed Cisco Express Forwarding deaktivieren.
Wenn Sie beispielsweise den ip ospf-Prozess mit 260.000 OSPF-Routen (Open Shortest Path First) auf dem RP löschen, erhalten Sie die folgende Fehlermeldung:
%FIB-3-NORPXDRQELEMS: Exhausted XDR queuing elements while preparing message for slot 2 -Process= "OSPF Router", ipl= 0, pid= 149 -Traceback= 41060B88 40D5C894 403D130C 403A4484 403AB49C 403AAB10 403AB7BC 40736FCC 407384E0 401BE9BC 401BE9A8
Wenn Sie eine große BGP-Routing-Tabelle haben und mehrere Routing-Flaps oder ein Neustart des Routers auftreten, wird Folgendes angezeigt:
%FIB-3-NORPXDRQELEMS: Exhausted XDR queuing elements while preparing message for slot 4 -Process= "BGP Router", ipl= 0, pid= 104 -Traceback= 600CDC74 600DC3D0 6038FA90 6036C940 60374510 604A2F30 60753168 604A2FAC 604A9BC0 6018BD8C 6018BD78
Hinweis: Diese Meldungen können zusammen mit %FIB-3-FIBDISABLE eingehen: Schwerer Fehler, Steckplatz 6: Kein Speicher und %FIB-3-NOMEMWARNING: Malloc-Fehler in DCEF.
Beim Senden von 100.000 BGP-Routen sehen Sie möglicherweise Folgendes:
%OSPF-5-ADJCHG: Process 100, Nbr 161.10.1.1 on GigabitEthernet3/1 from LOADING to FULL, Loading Done %OSPF-5-ADJCHG: Process 100, Nbr 161.10.1.1 on GigabitEthernet3/3 from LOADING to FULL, Loading Done %OSPF-5-ADJCHG: Process 100, Nbr 161.10.1.1 on GigabitEthernet3/2 from LOADING to FULL, Loading Done %OSPF-5-ADJCHG: Process 100, Nbr 161.10.1.1 on GigabitEthernet3/4 from LOADING to FULL, Loading Done %BGP-5-ADJCHANGE: neighbor 161.10.11.1 Up %FIB-3-FIBDISABLE: Fatal error, slot 6: no memory %FIB-3-FIBDISABLE: Fatal error, slot 3: no memory %SYS-2-MALLOCFAIL: Memory allocation of 65540 bytes failed from 0x401C783C, pool Processor, alignment 0 -Process= "BGP Router", ipl= 0, pid= 120 -Traceback= 401CAB20 401CCF80 401C7844 401C8044 40FD017C 40FD032C 40D65AFC 403D4174 403A7BA4 403AA4D0 40712200 40712EF4 4112E760 40712FE0 406EDD10 401C155C Queued messages: %SYS-3-LOGGER_FLUSHING: System pausing to ensure console debugging output. %FIB-3-NORPXDRQELEMS: Exhausted XDR queuing elements while preparing message for slot 4 -Process= "BGP Router", ipl= 0, pid= 104 -Traceback= 600CDC74 600DC3D0 6038FA90 6036C940 60374510 604A2F30 60753168 604A2FAC 604A9BC0 6018BD8C 6018BD78 %FIB-3-NOMEMWARNING: Malloc Failure in DCEF
Dieses Problem wird durch die Cisco Express Forwarding verursacht, bei der bei großen Routing-Updates zu viel RP-Speicher verwendet wird. Der RP verwendet XDR-Nachrichten in der freien Speicherwarteschlange der Cisco Express Forwarding IPC-Warteschlangen, um mit einer relativ langsamen Geschwindigkeit an die LCs weitergeleitet zu werden. Die Cisco Express Forwarding IPC-Nachrichtenrate ist derzeit auf 25 IPC-Nachrichten (aus einer beliebigen Warteschlange) pro Viertelsekunde beschränkt. Dies führt dazu, dass die Warteschlangen auf der RP-Seite zu einer enormen Größe wachsen, sodass kein freier RP-Speicher übrig bleibt. mallocfail tritt auf und deaktiviert Cisco Express Forwarding.
In diesem Fall können Sie den maximalen Pfad im BGP reduzieren, um die Informationsmenge zu reduzieren, die Cisco Express Forwarding an die LCs weitergeben muss, oder die TCP-Fenstergröße verringern, um die Geschwindigkeit eingehender BGP-Updates zu verringern. Weitere Informationen finden Sie unter Optimales Routing und Reduzierung des BGP-Speicherverbrauchs.
Wenn Sie eine Cisco IOS Software-Version mit einer höheren oder niedrigeren Version als 12.0(16)S, 12.0(16)ST, 12.1(9), 12.1(8a)E, 12.2(2) oder 12.2(2)T ausführen, können Sie günstige Ergebnisse erzielen, indem Sie die Parameter der cep anpassen f linecard ipc memory <0-128000 Kbyte> interface configuration command. Das Standardverhalten ist 25 Puffer. Dieser Wert hängt jedoch von der Switching-Plattform ab. Dieser LC-Speicher ist auf 50 % des gesamten verfügbaren Speichers beschränkt. Dieser Befehl:
Ermöglicht Ihnen, der Warteschlange für das Cisco Express Forwarding-Routing eine größere Menge an LC-Speicher zuzuweisen, um Nachrichten zu aktualisieren.
Ermöglicht dem RP, Speicherplatz freizugeben, indem Cisco Express Forwarding-Updates schneller freigegeben werden.
Verhindert, dass der niedrige Speicherstatus auf dem RP auftritt.
Wenn Sie die oben genannten Fehlermeldungen erhalten, ist die Erhöhung des LC IPC-Speichers die Lösung. Es wird empfohlen, diesen Befehl mit dem Parameter 10000 auszugeben. In den meisten Fällen löst dies das Problem. Der Befehl wird wie folgt verwendet:
Router(config)#ip cef linecard ipc mem ? <0-128000> Kbytes of linecard memory (limited to 50% of total) Router(config)#ip cef linecard ipc mem 10000 Router#show cef linecard detail CEF linecard slot number 0, status up, sync Linecard CEF version number 8 Sequence number 3, Maximum sequence number expected 27, Seq Epoch 1 Send failed 0, Out Of Sequence 0, drops 0 Linecard CEF reset 1, reloaded 1 33 elements packed in 4 messages(1030 bytes) sent 1 elements cleared linecard in sync after reloading 0/0/0 xdr elements in LowQ/MediumQ/HighQ 8/9/13 peak elements on LowQ/MediumQ/HighQ Input packets 0, bytes 0 Output packets 0, bytes 0, drops 0
Weitere Informationen zu diesem Befehl finden Sie unter ip cef linecard ipc memory.
Es wird empfohlen, dass Sie zunächst den Abschnitt Externe Datendarstellung (XDR) dieses Dokuments lesen, um die Erläuterung und Empfehlungen für diese Fehlermeldung besser zu verstehen.
Sie erhalten möglicherweise die folgende Fehlermeldung:
%FIB-3-FIBBADXDRLEN: Invalid XDR length. Type/len 6/29479. XDR at 0x622D1F2C -Traceback= 600C786C 601D4B50 602CF7A8 60183454 60183440
Die Meldung stammt von einem Meldungs-Validierungscode, der einige grundlegende Überprüfungen von XDR-Nachrichten durchführt. In diesem Fall wurde eine XDR-Nachricht vom Typ 6 empfangen, deren Längenfeld den Wert 29479 enthielt. Diese Länge ist größer als der Puffer, der die Daten enthält, sodass der Code diese Nachricht verwirft.
Bei der Serie 12000 kann ein Hardwarefehler der Fabric möglicherweise einige Pakete beschädigen, sodass die XDR-Fehlermeldung angezeigt wird. Überprüfen Sie die Switching-Fabric, indem Sie den Befehl show controller fia ausführen, um festzustellen, ob in einem der SFCs zyklische Redundanzprüfungen (CRCs) vorhanden sind. Sie sollten auch das Protokoll überprüfen, um festzustellen, ob es andere Meldungen gibt, die Informationen zur weiteren Fehlerbehebung für diese Fehlermeldung bereitstellen können.
Sie erhalten diese Meldung, wenn der RP eine Out-of-Sequence-IPC-Nachricht vom LC erhalten hat. Infolgedessen wurde Cisco Express Forwarding Switching auf dem angegebenen Steckplatz deaktiviert.
Unter bestimmten Umständen mit einer großen Anzahl von Routen oder wenn der RP neu geladen wird, wird möglicherweise die folgende Fehlermeldung auf der RP-Konsole angezeigt.
%FIB-3-FIBLC_OOSEQ: Slot 11 disabled - Out of Sequence. Expected 9637, received 9638
Diese Meldung kann zusammen mit der folgenden steckplatzspezifischen Meldung angezeigt werden:
SLOT 11:%FIB-3-FIBSEQ: Out of sequence. State 9637 Rcvd 9638
Geben Sie den Befehl show cef linecard ein, um zu überprüfen, ob Cisco Express Forwarding in einem Steckplatz deaktiviert wurde (siehe unten).
router#show cef linecard CEF table version 40975, 47 routes Slot CEF-ver MsgSent XdrSent Seq MaxSeq LowQ HighQ Flags 11 40750 9642 164473 9639 9661 0 0 up, sync, disabled
Es gibt keine funktionalen Konsequenzen. Die FIB-Tabelle wird neu geladen, wenn dieses Ereignis auftritt. Wenn Sie das Problem weiterhin haben, können Sie den Clear cef Linecard <slot #>-Befehl ausstellen. Überprüfen Sie anschließend den Status des LC, indem Sie den Befehl show cef linecard eingeben. Auf der Serie 7500 können Sie versuchen, Cisco Express Forwarding zu deaktivieren und wieder zu aktivieren. Wenn das Problem weiterhin auftritt, sollte das Problem durch die Ausgabe eines Microcode-Befehls zum VIP gelöst werden. Auf der 12000-Serie löst der Befehl hw-module slot <slot #> reload das Problem, der dem LC ausgegeben wird.
Sie erhalten die Nachricht %FIB-4-PUNTINTF, wenn Cisco Express Forwarding aufgrund der aktuellen Konfiguration einige oder alle Pakete nicht über diese Schnittstelle verteilen kann. Cisco Express Forwarding verarbeitet Pakete, die an diese Schnittstelle weitergeleitet werden, an den nächsten langsameren Switching-Pfad. Weitere Informationen zu den verschiedenen Switching-Pfaden finden Sie unter How to Choose the Best Router Switching Path for Your Network (So wählen Sie den besten Router-Switching-Pfad für Ihr Netzwerk aus.
Sie erhalten die Meldung %FIB-5-NOPUNTINTF, wenn Cisco Express Forwarding Pakete, die an diese Schnittstelle gesendet wurden, auf den nächsten langsameren Switching-Pfad gesendet hat und die Schnittstellenkonfiguration so geändert wurde, dass Cisco Express Forwarding das Switching auf diese Schnittstelle wieder aufnehmen kann. Dies ist nur eine Informationsmeldung, und in den meisten Fällen ist keine Maßnahme erforderlich.
%FIB-4-PUNTINTF: CEF punting packets switched to POS2/0/0.1 to next slower path
Nach einer Änderung der Schnittstellenkonfiguration kann die folgende Meldung folgen:
%FIB-5-NOPUNTINTF: CEF resuming switching packets to POS2/0/0.1
Wenn der Befehl ip cef global aktiviert ist und der Befehl no ip route-cache cef auf einer virtuellen Vorlage konfiguriert ist und die Version 12.1(6) der Cisco IOS-Software ca. 12.1(6) lautet, werden die folgenden Meldungen angezeigt, wenn die virtuellen L2F-Zugriffsschnittstellen Mitglieder der Master-Multilink PPP-Pakete werden:
%FIB-4-PUNTINTF: CEF steuert Pakete, die zu Virtual-Access14 auf den nächsten langsameren Pfad umgestellt werden
%FIB-5-NOPUNTINTF: CEF setzt Switching-Pakete für Virtual-Access wieder ein14
%FIB-4-PUNTINTF: CEF steuert Pakete, die zu Virtual-Access37 auf den nächsten langsameren Pfad umgestellt wurden
%FIB-5-NOPUNTINTF: CEF setzt Switching-Pakete für Virtual-Access wieder ein37
Eine Problemumgehung besteht darin, die Protokollierungsebene so einzustellen, dass diese Meldungen nicht angezeigt werden. Eine weitere Möglichkeit ist die globale Deaktivierung der IP Cisco Express-Weiterleitung. Die Deaktivierung von Cisco Express Forwarding sollte jedoch eine vorübergehende Problemumgehung sein, da sie die beste Switching-Methode ist, die auf einigen Plattformen verfügbar ist. Bei den Serien 7500 und 1200 ist Distributed Cisco Express Forwarding die beste Switching-Methode, dann Cisco Express Forwarding und dann alle Legacy-Forwarding.
Von den folgenden Cisco IOS Software-Versionen nach vorne: 12.1(8), 12.1(08a)E, 12.2(1)S, 12.1(8)AA, 12.0(17)S, 12.0(17)ST, 12.2(1)T, 012.02(2) - Nachrichten werden nicht protokolliert, wenn Sie das PUNT-Flag auf einer Schnittstelle festlegen oder löschen. Es ist weiterhin möglich, den Befehl show cef interface auszugeben oder den Befehl debug ip cef events zu aktivieren, um zu überprüfen, ob Cisco Express Forwarding aktiviert ist. Daher besteht keine Gefahr, dass Benutzer unnötigerweise spammend werden, wenn eine Schnittstelle so konfiguriert ist, dass Pakete auf den nächsten langsameren Pfad übertragen werden. Router werden beim Hochfahren oder beim Starten von Cisco Express Forwarding nicht mit Nachrichten überlastet, und Systemprotokolle werden nicht mit Meldungen gefüllt, die bei jedem Anruf auf Wählplattformen protokolliert werden.
Wenn möglich, sollten Sie die von Cisco Express Forwarding unterstützten und nicht von Cisco Express Forwarding unterstützten Funktionen auf verschiedenen Subschnittstellen konfigurieren. Einige Kapselungen an ATM-Schnittstellen werden von Cisco Express Forwarding nicht unterstützt. Sie müssen den Cisco IOS Software Configuration Guide (Cisco IOS Software-Konfigurationsleitfaden) konsultieren, um zu erfahren, welche Kapselungen unterstützt werden und welche nicht.
Diese Meldungen auf dem Router sind Teil der Hardware-CEF-Ausfallsicherheit. Ab IOS Version 12.0(28)S wird die Hardware-CEF-Ausfallsicherheitsfunktion auf Line Cards der Cisco Serie 12000 Engine 2 (E2) und IP Services Engine (ISE) unterstützt. Die Hardware-CEF-Ausfallsicherheit ist ein Schutzmechanismus für CEF-Hardwarespeicher und ASIC-Weiterleitungsressourcen. Die Hardware-CEF-Ausfallsicherheit verhindert, dass CEF deaktiviert wird und die Paketweiterleitung bei Ressourcenausfall oder einem Fehlerzustand, z. B. bei einem Ausfall des Speichers oder bei einem IPC-Fehler, beeinträchtigt wird. Der Linecard-Gerätetreiber verarbeitet Ressourcenfehler intern, ohne dass die oberen Ebenen involviert sind.
Wenn auf einer Line Card der Cisco Serie E2 oder ISE der Serie 1200 ein Hardware-Forwarding-Speicher (PLU oder TLU) ausgeführt wird oder ausfällt, gibt die Ressourcenüberwachungsfunktion einen Alarm (eine Fehlermeldung oder Warnung, wie im Protokoll angezeigt wird) in der Systemkonsole aus und protokolliert den Alarm. Wenn ein Fehler bei der Speicherzuweisung auftritt, wird im Hintergrund ein Timer-basierter Ressourcenüberwachungsprozess aktiviert. Der Prozess überprüft den Prozentsatz des PLU- und TLU-Hardware-Forwarding-Speichers, der in Abständen von einer Minute verwendet wird. Bei Überschreitung der prozentualen Speichererschöpfung wird ein Alarm ausgelöst. Schließlich bezieht sich die Fehlermeldung auf den TLU-Speicher. Dies ist ein Speicher fester Größe, der nicht aktualisiert werden kann.
Die Lösung besteht darin,
Reduzierung der Anzahl von Routen
PSA-ACLs deaktivieren (kein Zugriffslisten-Hardware-PSA)
Hier sind einige Beispiele für die Meldung, die in Fehlerprotokollen angezeigt wird:
%FIB-4-FIBCBLK: Missing cef table for tableid 63 during route update XDR event %FIB-SP-4-FIBCBLK: Missing cef table for tableid 33 during Table removal event %FIB-4-FIBCBLK: Missing cef table for tableid 45 during routing table event
Die Ursache für diese Meldungen liegt darin, dass eine VRF-Löschanforderung generiert wird, bevor die zugehörigen NDB-Updates (Network Descriptor Block) verteilt und von Linecards verarbeitet werden. Dies verursacht ein temporäres Problem in der CEF-Tabelle, bei dem eine Tabelle-ID generiert wird, die Tabelle jedoch selbst entfernt wird. Dieses Problem wird in der Regel ohne Eingreifen behoben, und es besteht keine Beeinträchtigung des Datenverkehrs oder der Stabilität des Routers. Die Cisco Bug-IDs CSCsg03483 und CSCee26209 beschreiben ähnliche Systemmeldungen.
Wenn Sie mit dem TAC Service Request Tool eine TAC Service Request erstellen (nur registrierte Kunden), fügen Sie Ihrem Fall die folgenden Informationen zur Fehlerbehebung für Cisco Express Forwarding-bezogene Fehlermeldungen bei: |
---|
Hinweis: Laden Sie den Router vor dem Erfassen der oben genannten Informationen nicht manuell neu oder starten Sie ihn nur, wenn dies zur Fehlerbehebung bei Fehlermeldungen im Zusammenhang mit der Cisco Express Forwarding erforderlich ist. Dies kann dazu führen, dass wichtige Informationen verloren gehen, die zur Bestimmung der Ursache des Problems erforderlich sind. |
Weitere Informationen zur Fehlerbehebung bei Cisco Express Forwarding finden Sie in den folgenden Dokumenten:
Fehlerbehebung beim Lastenausgleich über parallele Verbindungen mit Cisco Express Forwarding
Beheben von Inkonsistenzen bei Präfixen mit Cisco Express Forwarding
Fehlerbehebung bei unvollständigen Angriffen mit Cisco Express Forwarding
Überarbeitung | Veröffentlichungsdatum | Kommentare |
---|---|---|
1.0 |
24-Jun-2008 |
Erstveröffentlichung |