En raras circunstancias, el procesador principal de los adaptadores de puerto ATM PA-A3 puede desconectar e imprimir en la consola un "crashdump" con un resultado similar al siguiente:
%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump: %ATMPA-7-REG00: status 0xF040FF00, cause 0x00008018, epc 0xBFC002EC %ATMPA-7-REG01: ccc 0x03E7B620, eepc 0x00000000, apu_status 0x00015010 %ATMPA-7-REG02: edma_src 0x4B050964, edma_dest 0xA0820968, edma_cntl 0x00280000 %ATMPA-7-REG03: edma_count 0x060001E0, edma_status 0x00000000, aci_cntrl 0x44400540 %ATMPA-7-CWREG00: zero 0xBABEBABE, at 0x10000000, v0 0xBFC002EC, v1 0xF040FF00 %ATMPA-7-CWREG01: a0 0xB8000804, a1 0x08000000, a2 0x00000190, a3 0x10338530 %ATMPA-7-CWREG02: t0 0x8066B590, t1 0x00015010, t2 0x4B050964, t3 0xA0820968 %ATMPA-7-CWREG03: t4 0x060001E0, t5 0x00280000, t6 0x00000000, t7 0x44400540 %ATMPA-7-CWREG04: s0 0xC0000000, s1 0x00008001, s2 0x00000000, s3 0x00000000 %ATMPA-7-CWREG05: s4 0xB8100000, s5 0x4B01EA44, s6 0x88800000, s7 0x008002F4 %ATMPA-7-CWREG06: t8 0xF557C400, t9 0xB8000000, k0 0x00000000, k1 0xAB0DE6D4 %ATMPA-7-CWREG07: gp 0x8080309C, sp 0x8080398C, fp/s8 0xCCCCCCCD, ra 0x80801440 %ATMPA-7-MISC0: 00 0x00008001, 01 0x00000000, 02 0x00000000, 03 0xB8100000 %ATMPA-7-MISC1: 04 0x4B01EA44, 05 0x88800000, 06 0x008002F4, 07 0x00000000 %ATMPA-7-MISC2: 08 0x00000000, 09 0x00000000, 10 0x00000000, 11 0x00000000 %ATMPA-7-MISC3: 12 0x00000000, 13 0x00000000, 14 0x00000000, 15 0x00000000
Este documento explica cómo resolver problemas de caídas de segmentación y reensamblado (SAR) en el PA-A3.
No hay requisitos específicos para este documento.
Este documento no tiene restricciones específicas en cuanto a versiones de software y de hardware.
For more information on document conventions, refer to the Cisco Technical Tips Conventions.
El PA-A3 utiliza un chip llamado LSI ATMizer II para proporcionar SAR así como otras funciones clave. El nombre del SAR se muestra en la salida del comando show controllers atm.
router# show controller atm 3/0 Interface ATM3/0 is up Hardware is ENHANCED ATM PA - DS3 (45Mbps) Lane client mac address is 0030.7b1e.9054 Framer is PMC PM7345 S/UNI-PDH, SAR is LSI ATMIZER II Firmware rev: G119, Framer rev: 1, ATMIZER II rev: 3 !--- Output suppressed.
El microcódigo ATMizer (firmware) es una imagen que ofrece instrucciones del software específico de SAR. El IOS® del Procesador de interfaz versátil (VIP) en la plataforma Cisco 7500 y el IOS del sistema en la plataforma 7200 contienen el firmware SAR, que se descarga en el SAR cuando sale del reinicio. Utilice los siguientes comandos en función de la plataforma utilizada para mostrar la versión de microcódigo cargada y ejecutada actualmente para su interfaz ATM:
serie 7200 - show controller atm (ver el ejemplo de resultado que figura anteriormente).
serie 7500 - show controller vip slot# tech
El PA-A3 utiliza dos SAR para proporcionar la potencia de procesamiento necesaria para manejar y transmitir simultáneamente para un link OC-3 y OC-12 de alta velocidad.
Nota: Un único SAR es suficiente para un DS-3/E-3, pero el PA-A3-T3 también utiliza dos SAR para la consistencia.
El crashdump SAR indica qué SAR está experimentando el problema.
%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump: SAR0 = receive SAR1 = transmit
El PA-A3 se soporta en la serie de routers 7xxx. Los routers 7200 y 7500 utilizan buses de interconexión de componentes periféricos (PCI) como ruta de datos entre los adaptadores de puerto y la memoria de "host". La memoria host es la SRAM local en el VIP o la SRAM en el motor de procesamiento de red (NPE) del 7200.
Este diagrama ilustra la arquitectura del VIP2 y la ubicación de los buses PCI:
El SAR ofrece conectividad al bus PCI para las transferencias dentro de la memoria del paquete. También proporciona funcionalidad SAR para el procesamiento de celdas de ATM y una PHY o interfaz física para el cable externo.
Podemos clasificar los desperfectos SAR en varias categorías según la causa del desperfecto. Siempre que se produce un error no recuperable, se produce un desperfecto en el SAR. Estos errores pueden ser el resultado de software o hardware. Para determinar la causa, consulte el registro de causa que aparece en la segunda línea de la salida de crashdump. El Código de excepción se registra en los bits dos a seis del valor de registro de causa. Comience desde el bit más a la derecha como bit cero. Por ejemplo:
%ATMPA-7-REG00: status 0xF040FF10, cause 0x00004018, epc 0x80802F68
Traduzca el valor hexadecimal de 0x00004018 en binario. Observe que cada valor hexadecimal representa cuatro bits. El equivalente binario en nuestro ejemplo es 4 = 0100, 0 = 0000, 1 =0001 y 8 = 10000, luego 0x00004018 = 0100 00000110 000.
Localice los bits dos a seis contando de derecha a izquierda. En nuestro ejemplo, los bits dos a seis equivalen a 00110
Vuelva a convertir estos cinco bits en hexadecimales. En nuestro ejemplo, 00110 se convierte en 0x06.
Consulte la tabla de códigos de excepción. En el ejemplo, el SAR falló en respuesta a una excepción de error de bus secundario.
Código de excepción | Descripción | Causa probable |
0x00 | Interrupción | Condición de interrupción asegurada. |
0x01 | Excepción de modificación TLB | |
0x02 | Excepción TLB (carga/captura) | |
0x03 | Excepción TLB (almacenamiento) | |
0x04 | Error de dirección (carga/búsqueda) | Dirección no alineada (software) |
0x05 | Error de dirección (almacenamiento) | Dirección no alineada (software) |
0x06 | Error de bus | Tiempo de espera del bus, errores de paridad, etc. (hardware). |
0x07 | Reservado | |
0x08 | Syscall | Intente ejecutar la instrucción SYSCALL. |
0x09 | Punto de derivación | Intento de ejecutar instrucción BREAK. |
0x0a | Instrucción reservada | Intento de ejecutar una instrucción inválida. |
0x0b | Coprocesador inutilizable | Trata de ejecutar un coprocesador inutilizable. |
0x0c | Desbordamiento aritmético | |
0x0d | Trampa | |
0x0e | Reservado | |
0x0f | Punto flotante | Intento de acceder a FPU inexistente. |
0x10-1f | Reservado |
Cuando cualquier registro de causa de valor tiene el bit 15 configurado en uno, la causa de la caída de SAR es un error de PCI o de paridad debido al hardware. Específicamente, el registro de causa aparecerá en el volcado de bloqueo como:
cause 0x00008000
Solucione los problemas de este valor de causa reemplazando el adaptador de puerto ATM. Si el problema persiste, sustituya el procesador de interfaz versátil (VIP) si utiliza un router serie 7500 o el motor de procesamiento de red (NPE)/motor de servicios de red (NSE) si utiliza un router serie 7200 o 7400.
El ID de bug de Cisco CSCdr09895 evita que los crashdumps repetidos se impriman en la consola, ya que sólo el primer volcado de memoria es relevante para la resolución de problemas. Los siguientes ID de bug resuelven condiciones poco comunes que causan caídas SAR. Utilice el Bug Toolkit (sólo clientes registrados) para determinar si su versión de Cisco IOS Software se ve afectada por estos ID de bug.
ID de falla de funcionamiento de Cisco | Explicación |
CSCdp62791 | Evita desperfectos en SAR1 ya que no envía paquetes a SAR en un VC no configurado o no envía paquetes a SAR con encapsulación no válida. Nota: Aunque informa de un síntoma diferente, CSCdp01166 dobla y se fija a través de CSCdp62791. |
CSCdp42529 | Evita los desperfectos de SAR1 producidos al recibir una celda en un par VPI/VCI que no existe en SAR de transmisión. Este problema puede ocurrir cuando se crea o se desactiva una gran cantidad de SVC, por lo que el SAR de transmisión pierde una interrupción del comando de la CPU del host en el VIP o NPE. Cuando ocurre esto, se define un VC en el SAR receptor solamente y el SAR transmisor falla si se recibe un loopback OAM o una celda de administración de recursos en el par VPI/VCI no definido. |
CSCdr09895 | Evita desperfectos en el SAR0 que se producen cuando, con tráfico de mucho tránsito, el SAR intenta acceder a una dirección ilegal de la memoria secundaria, donde los paquetes esperan la segmentación y se almacenan los reensamblados. A esta condición de la denomina error de bus. |
CSCdp64588 | Evita una caída del router debido a caídas repetidas de SAR (0 o 1). Cuando el SAR falla, el controlador del host PCI (que proporciona una interfaz entre el PA-A3 y el bus PCI en el router) intenta iniciar el PA nuevamente. Si existen desperfectos reiterados de SAR y el PA no responde al controlador del host, éste último intenta cerrar (apagar) el PA y el PA es apagado. En algunos casos, si el SAR ha fallado y el host-driver ya ha borrado la memoria relacionada con este PA, el router falla debido al error de bus. |
Los siguientes puntos resumen cómo resolver problemas de caídas SAR en un adaptador de puerto ATM PA-A3:
Determine si SAR0 (receptor SAR) o SAR1 (transmisión SAR) se estrellaron. La primera línea del crashdump te lo dirá.
%ATMPA-3-SARCRASH: ATM1/0: SAR1 Chip Crashdump
Utilice la tabla de códigos de excepción para decodificar el valor de registro de causa en la salida de crashdump.
Si el registro de causa es un valor con el bit 15 configurado en uno, reemplace el hardware.
Si el registro de causas es otro valor, recopile la siguiente información para el Soporte Técnico de Cisco:
resultado de crashdump
show controller atm (serie 7200)
show controller vip slot# tech (serie 7500)
show tech-support
Considere seriamente instalar la versión de mantenimiento más reciente de la serie de software del IOS de Cisco que está ejecutando actualmente.
Revisión | Fecha de publicación | Comentarios |
---|---|---|
1.0 |
10-Sep-2018 |
Versión inicial |