In questo documento vengono elencate le cause dei messaggi di errore %SYS-3-CPUHOG e viene spiegato come risolverli.
Nessun requisito specifico previsto per questo documento.
Il documento può essere consultato per tutte le versioni software o hardware.
Le informazioni discusse in questo documento fanno riferimento a dispositivi usati in uno specifico ambiente di emulazione. Su tutti i dispositivi menzionati nel documento la configurazione è stata ripristinata ai valori predefiniti. Se la rete è operativa, valutare attentamente eventuali conseguenze derivanti dall'uso dei comandi.
Per ulteriori informazioni sulle convenzioni usate, consultare il documento Cisco sulle convenzioni nei suggerimenti tecnici.
Per ridurre l'impatto dei processi runaway, il software Cisco IOS® utilizza un timer di controllo dei processi che consente allo scheduler di eseguire periodicamente il polling del processo attualmente attivo. Questa funzionalità non equivale all'interruzione per diritti di priorità. Si tratta invece di un meccanismo di emergenza, che assicura che il sistema non perda risposta o si blocchi completamente a causa del consumo totale della CPU da parte di qualsiasi processo.
Se un processo sembra bloccarsi (ad esempio, se continua a funzionare per un lungo periodo), lo scheduler può forzare la chiusura del processo.
Ogni volta che lo scheduler consente l'esecuzione di un processo sulla CPU, avvia un timer di watchdog per tale processo. Trascorso un periodo prestabilito, se il processo continua a funzionare, il processo di watchdog genera un interrupt e provoca il riavvio del router per un "arresto forzato del software" (il trace dello stack mostra un processo di watchdog come causa del crash).
Alla prima scadenza del watchdog, viene visualizzato un messaggio di avviso, ad esempio:
%SYS-3-CPUHOG: Task ran for 2148 msec (20/13), Process = IP Input, PC = 3199482 -Traceback= 314B5E6 319948A
Questo messaggio indica che un processo ha bloccato la CPU. In questo caso, si tratta del processo di "ingresso IP". Questo messaggio viene in genere visualizzato in circostanze temporanee, ad esempio in caso di inserimento e rimozione online (OIR, Online Insertion and Removal) all'avvio del router o in condizioni di traffico elevato. I messaggi "%SYS-3-CPUHOG" non devono apparire durante il normale funzionamento del router.
Se il router è occupato a livello di interrupt dopo che è stata pianificata l'esecuzione di un processo, l'accounting della durata dell'esecuzione del processo può non essere accurato. Infatti, la CPU tiene traccia solo delle attività a livello di processo. Non tiene traccia delle attività a livello di interrupt che possono interrompere e controllare la CPU.
Il processo tipico da eseguire a livello di interrupt è la commutazione di pacchetto.
Questa sezione spiega come risolvere i problemi relativi ai messaggi CPUHOG in diversi scenari.
I messaggi CPUHOG al momento della sequenza di avvio sono piuttosto comuni. Il messaggio di errore stesso indica che il processo di avvio ha mantenuto la CPU per un tempo leggermente superiore a quello che il sistema desiderava fosse in grado di contenere, quindi ha inviato un messaggio all'output della console per informare l'utente. Il processo in questo caso è "Boot Load", che indica dove si è verificato il CPUHOG:
System Bootstrap, Version 11.1(12)XA, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) Copyright (c) 1997 by cisco Systems, Inc. C1600 processor with 16384 Kbytes of main memory program load complete, entry point: 0x4018060, size: 0x108968 %SYS-3-CPUHOG: Task ran for 2040 msec (6/6), Process = Boot Load, PC =40B513A -Traceback= 407EB6E 407F628 407D118 40180E0 40005B0 4015C3E 40152B2 4014ED4 40025B8 4003086 4015636 40021A8 400C616program load complete, entry point: 0x2005000, size: 0x4195b9 Self decompressing the image : ############################################################################ ############################################################################ ################################################################## [OK]
È possibile ignorare questo messaggio di errore. Al momento del processo di avvio, il boot loader usa la CPU per 2-4 secondi e non la rilascia. Questo non è un problema al momento dell'avvio, perché la CPU deve eseguire solo il caricatore di avvio in quel punto. Le ROM di avvio più recenti non consentono di stampare quel particolare messaggio.
È possibile inoltre ricevere un messaggio CPUHOG dall'immagine dell'helper di avvio ogni volta che il router carica un'immagine di grandi dimensioni, ad esempio quando si usano i router Cisco serie 1600. Questi router sono configurati con più di 16 MB di DRAM.
Questo messaggio viene visualizzato solo quando l'immagine viene caricata e non ha alcun effetto sul funzionamento del sistema o sul processo di caricamento. In ogni caso, si tratta di un problema cosmetico in quanto non ha alcun effetto sul normale funzionamento del sistema.
I messaggi CPUHOG sono comuni al momento della trasmissione di una OIR, in quanto il router deve eseguire una serie di attività complicate e relativamente lunghe. Non è necessario preoccuparsi dei messaggi CPUHOG che si verificano durante le OIR, a condizione che la scheda inserita venga visualizzata correttamente.
È possibile che venga visualizzato un messaggio CPUHOG quando si tenta di accedere a una periferica Flash, ad esempio una scheda Flash o un modulo SIMM (Single Inline Memory Module) Flash, se la periferica è difettosa o non risponde. Se il problema persiste, contattare il rappresentante TAC.
Nota: se si dispone di un Catalyst 6500 con software Cisco IOS integrato (modalità nativa) o ibrida e con messaggi CPUHOG quando si formatta il bootflash MSFC (RP):, è possibile che sia questo il problema indicato nell'ID bug Cisco CSCdw53175 (solo utenti registrati) risolto nelle versioni software Cisco IOS 12.1.11b, 12.1(12c)E5 o 12.1(13)E, e versioni successive.
Sul Cisco serie 12000 Internet Router, su ciascuna scheda di linea viene conservata la base di informazioni per l'inoltro (FIB) da utilizzare nella commutazione di pacchetto. A causa della struttura della struttura FIB, le modifiche di routing con subnet mask brevi (comprese tra /1 e /4) possono causare messaggi come questo nel log della console:
SLOT 1: %SYS-3-CPUHOG: Task ran for 4024 msec (690/0), process = CEF IPC Background, PC = 400B8908. -Traceback= 400B8910 408FF588 408FF6F4 408FFE8C 400A404C 400A4038
Quando un processo nel software Cisco IOS viene eseguito per più di 2000 ms (2 secondi), viene visualizzato un messaggio CPUHOG. Nel caso degli aggiornamenti Cisco Express Forwarding (CEF) per subnet mask molto brevi, la quantità di elaborazione richiesta può essere superiore a 2000 ms, il che può attivare questi messaggi. Il processo "CEF IPC Background" è il processo padre che controlla l'aggiunta e la rimozione dei prefissi dalla struttura di inoltro.
Inoltre, se la CPU viene bloccata per un periodo di tempo prolungato, la scheda di linea può bloccarsi a causa di un errore del ping del fabric o la FIB può essere disabilitata a causa di timeout di comunicazione IPC persi. Per risolvere questi problemi, vedere Risoluzione dei problemi di timeout e errori del ping dell'infrastruttura sul router Internet Cisco serie 12000.
In generale, gli aggiornamenti di routing con maschere più corte di /7 sono errati o dannosi. Cisco consiglia a tutti i clienti di configurare un filtro dei percorsi adeguato per impedire l'elaborazione e la propagazione di tali aggiornamenti. Per assistenza nella configurazione dei filtri di instradamento, contattare il supporto tecnico.
Quando si cancella il Border Gateway Protocol (BGP) o la tabella di routing, è possibile che venga attivato anche un messaggio CPUHOG a causa del processo "CEF IPC Background".
Nella maggior parte dei casi, questi messaggi di errore sono dovuti a un bug interno del software Cisco IOS.
Per risolvere questo tipo di messaggi di errore, occorre prima cercare un bug noto. È possibile usare Bug Toolkit (solo utenti registrati) per trovare un bug corrispondente all'errore. Nella pagina Bug Toolkit, fare clic su Launch Bug Toolkit, quindi selezionare Search for Cisco IOS-related bug (Cerca bug relativi a Cisco IOS). Per limitare la ricerca, è possibile selezionare la versione del software Cisco IOS in uso al numero 1. Al numero 3, è possibile eseguire una ricerca per parole chiave per "CPUHOG, <process>" dove process è il processo corrispondente, ad esempio Virtual Exec o IP Input.
È possibile effettuare l'aggiornamento all'ultima immagine software Cisco IOS nella sequenza di rilascio per eliminare tutti i bug risolti relativi alla CPU.
Se dopo aver eseguito le procedure di risoluzione dei problemi descritte sopra è ancora necessaria assistenza e si desidera aprire una richiesta di assistenza (solo utenti registrati) con Cisco TAC, includere le seguenti informazioni: |
---|
Nota: non ricaricare o spegnere e riaccendere manualmente il router prima di raccogliere le informazioni sopra menzionate, a meno che non sia necessario per risolvere un problema di scheda di linea sul router Cisco Internet serie 12000, in quanto ciò potrebbe causare la perdita di informazioni importanti necessarie per determinare la causa principale del problema. |
Revisione | Data di pubblicazione | Commenti |
---|---|---|
1.0 |
24-Jun-2008 |
Versione iniziale |