El conjunto de documentos para este producto aspira al uso de un lenguaje no discriminatorio. A los fines de esta documentación, "no discriminatorio" se refiere al lenguaje que no implica discriminación por motivos de edad, discapacidad, género, identidad de raza, identidad étnica, orientación sexual, nivel socioeconómico e interseccionalidad. Puede haber excepciones en la documentación debido al lenguaje que se encuentra ya en las interfaces de usuario del software del producto, el lenguaje utilizado en función de la documentación de la RFP o el lenguaje utilizado por un producto de terceros al que se hace referencia. Obtenga más información sobre cómo Cisco utiliza el lenguaje inclusivo.
Cisco ha traducido este documento combinando la traducción automática y los recursos humanos a fin de ofrecer a nuestros usuarios en todo el mundo contenido en su propio idioma. Tenga en cuenta que incluso la mejor traducción automática podría no ser tan precisa como la proporcionada por un traductor profesional. Cisco Systems, Inc. no asume ninguna responsabilidad por la precisión de estas traducciones y recomienda remitirse siempre al documento original escrito en inglés (insertar vínculo URL).
Este documento explica cómo identificar fallas por errores de bus y cómo resolver esas fallas según el tipo de procesador que tenga en su router Cisco.
Cisco recomienda leer Troubleshooting Router Crashes antes de continuar con este documento.
La información que contiene este documento se basa en las siguientes versiones de software y hardware.
Todas las versiones del IOS® de Cisco
Todos los routers Cisco
Nota: Este documento no se aplica a los switches Cisco Catalyst o a las plataformas MGX.
La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). If your network is live, make sure that you understand the potential impact of any command.
Consulte Convenciones de Consejos Técnicos de Cisco para obtener más información sobre las convenciones sobre documentos.
El sistema detecta un error de bus cuando el procesador intenta tener acceso a un lugar de la memoria que no existe (un error de software) o no responde correctamente (un problema de hardware). Se puede identificar un error de bus a partir de la salida del comando show version proporcionado por el router si no se apaga o se recarga manualmente.
Si tiene el resultado de un comando show version o show technical-support (desde el modo de habilitación) de su dispositivo Cisco, puede utilizarlo para mostrar posibles problemas y soluciones. Para poder utilizarlo, debe ser un cliente registrado, haber iniciado sesión y tener habilitado JavaScript.
Router uptime is 2 days, 21 hours, 30 minutes System restarted by bus error at PC 0x30EE546, address 0xBB4C4 System image file is "flash:igs-j-l.111-24.bin", booted via flash .........
En la indicación de la consola, este mensaje de error también se puede ver durante un error de bus:
*** System received a Bus Error exception *** signal= 0xa, code= 0x8, context= 0x608c3a50 PC = 0x60368518, Cause = 0x20, Status Reg = 0x34008002 .........
Después de esto, el router se recarga. En algunos casos, sin embargo, el router entra en un loop de desperfectos y recargas y se requiere intervención manual para salir de este loop.
Otro problema relacionado es un desperfecto del Procesador de interfaz versátil (VIP). Si ocurre este problema, se registran mensajes de error similares a estos:
%VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 %VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408, context=0x605B51E0
Finalmente, otro tipo de desperfecto por error de bus es un desperfecto de tarjeta de línea en un router de Internet de la serie 12000 de Cisco. Si ocurre este problema, se registran mensajes de error similares en el resultado de show context:
Router#show context ... CRASH INFO: Slot 1, Index 1, Crash at 11:27:15 utc Wed May 16 2001 VERSION: GS Software (GLC1-LC-M), Version 12.0(16.5)S, EARLY DEPLOYMENT MAINTENANCE INTERIM SOFTWARE TAC Support: http://www.cisco.com/pcgi-bin/ibld/view.pl?i=support Compiled Thu 29-Mar-01 17:12 by ninahung Card Type: 3 Port Gigabit Ethernet, S/N System exception: SIG=10, code=0x2008, context=0x40D8DF44 System restarted by a Bus Error exception STACK TRACE: -Traceback= 40165800 4038D0FC 4025C7BC 4026287C 4029581C 402EECF8 400C0144 CONTEXT: $0 : 00000000, AT : 00000000, v0 : 00000044, v1 : 0FE00020 a0 : 00000000, a1 : 0FE00000, a2 : 00000000, a3 : 39EC6AAB t0 : 00000030, t1 : 34008D01, t2 : 34008100, t3 : FFFF00FF t4 : 400C01E8, t5 : 00000001, t6 : 00000001, t7 : 00000001 s0 : 40DCDD20, s1 : 0FE00000, s2 : 00000000, s3 : 000005DC s4 : 00000000, s5 : 0FE00020, s6 : 00000004, s7 : 414CF120 t8 : 41680768, t9 : 00000000, k0 : 00000000, k1 : FFFF8DFD gp : 40CB9780, sp : 4105BFE8, s8 : 41652BA0, ra : 4038D0FC EPC : 0x40165800, SREG : 0x34008D03, Cause : 0x00002008 ErrorEPC : 0xBFC22B94 -Process Traceback= No Extra Traceback
Consulte Resolución de Problemas por Desperfectos de la Tarjeta de Línea en el Cisco 12000 Series Internet Router para obtener más detalles.
Si tiene el resultado de un comando show context de su dispositivo Cisco, puede utilizar Cisco CLI Analyzer para mostrar los posibles problemas y soluciones. Para utilizar la herramienta Analizador Cisco CLI, debe ser un cliente registrado, iniciar sesión y tener JavaScript habilitado.
Lo primero que se debe realizar es averiguar a qué ubicación de memoria (también denominada “dirección” u “operando de dirección”) intentó acceder el router cuando se produjo el error de bus. Con esta información, tiene un indicio para determinar si la falla tiene que ver con el software Cisco IOS o con el hardware del router. En el ejemplo, "System restart by bus error at PC 0x30EE546, address 0xBB4C4" (Sistema reiniciado por error de bus en la dirección 0xBB4C4), la ubicación de memoria a la que el router intentó acceder es 0xBB4C4. No confundir con el valor del contador de programa (PC) anterior.
Lo segundo que hay que hacer es determinar el tipo de procesador del router. Las ubicaciones de las direcciones de memoria para los routers varían según el tipo de procesador. Existen dos tipos principales de procesadores en los routers Cisco:
Procesadores 68000
Esto es parte de un resultado de show version que indica que el router tiene un procesador 68000:
cisco 2500 (68030) processor (revision D) with 8192K/2048K bytes of memory.
Las plataformas de router con procesadores 68000 incluyen:
Cisco 1000 Series Routers
Cisco 1600 Series Routers
Cisco 2500 Series Routers
Cisco 4000 Series Routers
Módulos de procesador de ruta (RP) en Routers de la serie 7000 de Cisco (RP)
Procesadores de computación con conjunto de instrucciones reducido (RISC)
Esto es parte de un resultado de show version que indica que el router tiene un procesador RISC:
cisco 3640 (R4700) processor (revision 0x00) with 49152K/16384K bytes of memory.
La entrada R (R4700) indica un procesador RISC.
Las plataformas de router con procesadores RISC incluyen:
Cisco 3600 Series Routers
Routers de la serie Cisco 4500
Routers de la serie 4700 de Cisco
Módulos RSP (procesador de conmutación de rutas) en routers de la serie Cisco 7500 y Cisco 7000 (RSP7000)
Módulos de Network Processor Engine (NPE) en routers Cisco 7200 Series
Multilayer Switch Feature Card (MSFC) en los Cisco 7600 Series Routers o en el Catalyst 6000 Switch
Módulos de Performance Routing Engine (PRE) en los Cisco 10000 Series Internet Routers
Módulos de Procesador de ruta Gigabit (GRP) en routers de Internet de la serie 12000 de Cisco
Una vez que haya determinado la dirección y el tipo de procesador, puede comenzar con una resolución de problemas más detallada.
Con la dirección a la que accedió el router cuando ocurrió el error de bus, utilice el comando show region para determinar la ubicación de memoria a la que corresponde la dirección. Si la dirección informada por el error de bus no se encuentra dentro de los rangos mostrados en el resultado de show region, esto significa que el router intentó acceder a una dirección que no es válida. Esto indica que es un problema con el software del IOS de Cisco. Utilice el Analizador de Cisco CLI (sólo clientes registrados) para decodificar la salida del comando show stacks e identificar el error de funcionamiento del software Cisco IOS que causa el error de bus.
Por otro lado, si la dirección se encuentra dentro de uno de los rangos en el resultado de show region, significa que el router accedió a una dirección de memoria válida, pero el hardware correspondiente a esa dirección no responde correctamente. Esto indica un problema de hardware.
Aquí hay un ejemplo de la salida de show region:
Router#show region Region Manager: Start End Size(b) Class Media Name 0x00000000 0x007FFFFF 8388608 Local R/W main 0x00001000 0x0001922F 98864 IData R/W main:data 0x00019230 0x000666B3 316548 IBss R/W main:bss 0x000666B4 0x007FEFFF 7965004 Local R/W main:heap 0x007FF000 0x007FFFFF 4096 Local R/W main:flhlog 0x00800000 0x009FFFFF 2097152 Iomem R/W iomem 0x03000000 0x037FFFFF 8388608 Flash R/O flash 0x0304033C 0x037A7D3F 7764484 IText R/O flash:text
Nota: En algunas versiones anteriores de Cisco IOS Software, este comando no está disponible. El comando show region output es parte del comando tech-support output desde la versión 12.0(9) de software del IOS de Cisco.
Las direcciones se muestran en formato hexadecimal. Las direcciones incluidas en los intervalos "Inicio" y "Fin" son direcciones de memoria válidas.
Main" corresponde a la memoria principal o RAM dinámica (DRAM).
iomem corresponde a la memoria de entrada/salida (E/S), lo que significa diferentes partes para diferentes plataformas. Por ejemplo, DRAM para el Cisco 2500, RAM compartido (SRAM) para el Cisco 4000.
Siguiendo con el ejemplo anterior, System restart by bus error at PC 0x30E546, address 0xBB4C4, este desperfecto de error de bus proviene de un router Cisco 2500 con el resultado show region. La dirección 0xBB4C4 es equivalente a 0x000BB4C4. Con el resultado de show region, esta dirección se encuentra dentro del rango de "main", o más específicamente, "main:heap" o 0x000666B4-0x007FEFFF. Como se mencionó antes, "main" corresponde a la memoria principal o a la DRAM, por lo que deben verificarse los chips DRAM.
Si este es un nuevo router o si el router fue movido de su ubicación hacia otra, los chips de memoria a menudo se aflojan. Una buena opción es volver a colocar o presionar firmemente los chips de memoria en la ranura. La mayoría de las veces, esto es suficiente para resolver este tipo de desperfecto.
Para los fallos de error de bus con direcciones que no se encuentran dentro de los rangos de direcciones show region, utilice el Analizador de Cisco CLI para decodificar la salida del comando show stacks e identificar el error de Cisco IOS Software que está causando el error de bus. Si no está seguro sobre qué identificación de falla puede coincidir o qué versión del software IOS de Cisco contiene la solución del problema, una opción que suele resolverlo es actualizar la versión de dicho software a la versión final del tren de versión, ya que esto generalmente contiene la solución para un gran número de fallas.
Si tiene el resultado de un comando show stacks o show technical-support (from enable mode) de su dispositivo Cisco, puede utilizar Cisco CLI Analyzer para visualizar los posibles problemas y soluciones. Para utilizar la herramienta Analizador Cisco CLI, debe ser un cliente registrado, iniciar sesión y tener JavaScript habilitado.
Se recomienda que lea la sección Resolución de problemas de caídas de error de bus en plataformas de procesador 68000 antes de continuar con esta sección.
En procesadores RISC, el software IOS de Cisco usa direcciones virtuales mediante el uso del Búfer de traducción de direcciones (TLB) que traduce direcciones virtuales en direcciones físicas. La dirección notificada por errores de bus en procesadores RISC es por ende la dirección virtual a diferencia de la dirección física utilizada por los procesadores 68000.
La salida del comando show region se debe utilizar para verificar la dirección informada por el error de bus. Para ilustrar esto, consideremos el siguiente ejemplo:
System was restarted by bus error at PC 0x60104864, address 0xC
Mediante la salida del comando show region que se muestra a continuación puede verificar que 0xC no es una dirección virtual válida, y puede concluir que el error de bus fue causado por un problema de software. Utilice Cisco CLI Analyzer (registered sólo para clientes) para decodificar la salida del comando show stacks o show technical-support (from enable mode) e identificar el error de funcionamiento del software Cisco IOS que está causando el error de bus.
Otra ventaja de utilizar el comando show region es que el mapeo de la memoria depende de la cantidad de memoria instalada en el router. Por ejemplo, si tiene 64 MB de DRAM (64 x 1024 x 1024 = 67108864 bytes = 0x4000000 bytes), el rango DRAM es 0x60000000 - 0x63FFFFFF para 64 MB. Esto se confirma con el comando show region:
Router#show version | i of memory cisco RSP2 (R4700) processor with 65536K/2072K bytes of memory. Router#show region Region Manager: Start End Size(b) Class Media Name 0x40000000 0x40001FFF 8192 Iomem REG qa 0x40002000 0x401FFFFF 2088960 Iomem R/W memd 0x48000000 0x48001FFF 8192 Iomem REG QA:writethru 0x50002000 0x501FFFFF 2088960 Iomem R/W memd:(memd_bitswap) 0x58002000 0x581FFFFF 2088960 Iomem R/W memd:(memd_uncached) 0x60000000 0x63FFFFFF 67108864 Local R/W main 0x60010908 0x60C80B11 13042186 IText R/O main:text 0x60C82000 0x60F5AF1F 2985760 IData R/W main:data 0x60F5AF20 0x610E35FF 1607392 IBss R/W main:BSS 0x610E3600 0x611035FF 131072 Local R/W main:fastheap 0x61103600 0x63FFFFFF 49269248 Local R/W main:heap 0x80000000 0x83FFFFFF 67108864 Local R/W main:(main_k0) 0x88000000 0x88001FFF 8192 Iomem REG QA_k0 0x88002000 0x881FFFFF 2088960 Iomem R/W memd:(memd_k0) 0xA0000000 0xA3FFFFFF 67108864 Local R/W main:(main_k1) 0xA8000000 0xA8001FFF 8192 Iomem REG QA_k1 0xA8002000 0xA81FFFFF 2088960 Iomem R/W memd:(memd_k1)
Si tiene un error de bus en 0x65FFFFFF, el resultado de show region toma en cuenta la cantidad de memoria y le dice que es una dirección ilegal (error de software).
En resumen:
Utilice el comando show region para verificar si la dirección indicada por el error de bus se encuentra dentro de los rangos de direcciones utilizados por el router.
Si la dirección se encuentra dentro de un rango de direcciones virtuales, reemplace el hardware correspondiente a este rango.
Si la dirección no se encuentra dentro de un rango de direcciones virtuales, utilice Cisco CLI Analyzer (registered customers only) para decodificar la salida del comando show stacks o show technical-support (from enable mode) e identificar el error de software de Cisco IOS que está causando el error de bus.
Considere seriamente instalar la versión de mantenimiento más reciente de la serie de software del IOS de Cisco que está ejecutando actualmente.
Un tipo especial de caída por error de bus es cuando la caída es provocada por un Contador de programa (PC) dañado. El valor de PC es la ubicación de la instrucción que el procesador estaba ejecutando cuando ocurrió el error de bus. Cuando ocurre un error de bus causado por una PC dañada, aparece el siguiente mensaje en la consola:
%ALIGN-1-FATAL: Corrupted program counter pc=0x0, ra=0x601860BC, sp=0x60924540, at=0x60224854
En este caso, la PC ha saltado a la dirección 0x0 (probablemente debido a un puntero nulo), pero aquí no está ubicada la instrucción. Es un problema de software por lo que no hay necesidad de verificar con el comando show region.
En otras plataformas RISC (Cisco 3600, 4500,etc. ), cuando se hace un salto a una PC ilegal, se obtiene una excepción SegV y no un error de bus.
Otro tipo de caída de error de bus que ocurre de vez en cuando es cuando el valor de PC es igual al valor de dirección. Por ejemplo:
System returned to ROM by bus error at PC 0x606B34F0, address 0x606B34F0
Desde el archivo crashinfo:
Unexpected exception, CPU signal 10, PC = 0x606B34F0 $0 : 00000000, AT : A001A24A, v0 : 00000000, v1 : 00000000 a0 : 00000000, a1 : 429CC394, a2 : 00000000, a3 : 62544344 t0 : 6069F424, t1 : 3400FF00, t2 : FFFFFFFB, t3 : 00000000 t4 : 606B8E68, t5 : 80000000, t6 : AA5C1022, t7 : 62FDE9D4 s0 : 62300000, s1 : 6281A1B8, s2 : 80007E20, s3 : 00000001 s4 : 00000001, s5 : 00000000, s6 : 62310000, s7 : 62544344 t8 : 62FDEA1C, t9 : 0D0D0D0D, k0 : 623079C0, k1 : 00000014 gp : 620B9E20, sp : 61E7E300, s8 : 00000000, ra : 606B8E68 EPC : 606B34F0, ErrorEPC : 606B8E68, SREG : 3400FF02 Cause 00004018 (Code 0x6): Instruction Bus Error exception -Traceback= 606B34F0 606B8E68
Observe que el valor del registro k1 es 0x14 (hexadecimal), que es igual a 20 en decimal. Esto apunta a una excepción de paridad de caché. En este caso en particular, el error de paridad no se maneja correctamente y está siendo enmascarado por un error de bus. El router ha dejado de funcionar debido a un error de bus de software en la función y ha gestionado una excepción de paridad de la memoria caché.
Debe considerar esta caída como una provocada por error de paridad común de la memoria del procesador y seguir las recomendaciones suministradas en Errores de paridad de la memoria del procesador (PMPE).
También debe considerar la actualización de la versión del software IOS de Cisco a una versión que tenga una corrección para CSCdv68388 - “Cambiar el administrador de excepción de error de caché para reanudar sin problema” que se corrigió a partir de la versión 12.2(10) del software IOS de Cisco.
Esta sección se centra en las técnicas generales de troubleshooting para los loops de inicio de excepción de error de bus:
El software del IOS de Cisco cargado no admite el hardware instalado
Falla de software
Hardware instalado incorrectamente
Falla de hardware
Verifique que todas las tarjetas de red sean compatibles con el software Cisco IOS. El Software Advisor (solo para clientes registrados) le ofrece las versiones mínimas del software Cisco IOS necesarias para el hardware. Verifique también que la imagen de la memoria de inicialización sea compatible con el hardware que se instaló si posee un router que soporta una imagen de arranque, como los routers de la serie Cisco 7200 y Cisco 7500.
En los routers 2600 y 3600, la memoria de E/S del router se puede configurar como un porcentaje de la memoria principal. Si la configuración de la memoria de E/S no es apropiada para los módulos de red o las tarjetas de interfaz WAN (WIC) instaladas, la plataforma 2600/3600 puede tener problemas para arrancar y puede fallar debido a errores de bus.
Si recientemente se ha realizado un cambio en la configuración del software y el router está en un loop de inicio, un bug de software puede estar causando este problema.
Si el router no puede arrancar, puede omitir la configuración para identificar si eso está causando el problema. Siga estos pasos:
Entre en ROMMON enviando la secuencia de interrupción al router durante los primeros 60 segundos del inicio.
Desde ROM Monitor, utilice el comando confreg para cambiar el registro de configuración a una configuración, como 0x2142, para ignorar la configuración del router:
rommon 1 > confreg 0x2142 You must reset or power cycle for new config to take effect rommon 2 > reset
Si el router se inicia sin ningún error, existe un problema de configuración que causa el problema. Compruebe que su configuración es compatible con el software del IOS de Cisco y con el hardware. Si es compatible, utilice el Bug Toolkit (sólo para clientes registrados) para identificar cualquier error de software que pueda estar experimentando. Considere seriamente instalar la versión de mantenimiento más reciente de la serie de software del IOS de Cisco que está ejecutando actualmente.
Si experimenta un loop de inicio de excepción de error de bus, puede ser causado por un hardware mal asentado. Para las plataformas de menor capacidad como el router 3600 o 4000, vuelva a colocar los módulos de red/procesadores de red.
Para plataformas de gama más alta como los routers 7200 o 7500, vuelva a colocar el procesador, VIP, adaptadores de puerto o tarjeta de línea que se está recargando debido a una excepción de error de bus.
La información contenida en el error de bus no ayuda a aislar el hardware. Por lo tanto, es importante quitar y volver a insertar las tarjetas para encontrar el problema de hardware. Estos son algunos pasos recomendados para aislar el problema:
**Si el router no experimenta el loop continuo luego de seguir los pasos de solución de problemas descriptos anteriormente, entonces el problema pudo haber sido causado por un módulo de red mal asentado. Se recomienda que vigile el router durante 24 horas para asegurarse de que siga funcionando sin que vuelva a producirse el error.
Si aún necesita ayuda después de seguir los pasos de troubleshooting anteriores y desea abrir un caso con el Soporte Técnico de Cisco, asegúrese de incluir la siguiente información para troubleshooting de un error de bus o excepción de error de bus: |
---|
Nota: No recargue ni apague y encienda manualmente el router antes de recopilar la información anterior a menos que sea necesario para resolver una excepción de error de bus, ya que esto puede causar la pérdida de información importante necesaria para determinar la causa raíz del problema. |
Revisión | Fecha de publicación | Comentarios |
---|---|---|
1.0 |
09-Nov-2001 |
Versión inicial |