Este documento provee información para resolver un problema de colapso del Procesador de Interfaz Versátil (VIP).
Cisco recomienda que tenga conocimiento de los Avisos de Campo del Router de la Serie 7500.
La información que contiene este documento se basa en las siguientes versiones de software y hardware.
VIP1
VIP2-10
VIP2-15
VIP6-20
VIP 2-40
VIP2-50
FEIP2
GEIP
GEIP+
VIP 4-50
VIP4-80
VIP6-80
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. If your network is live, make sure that you understand the potential impact of any command.
Para interpretar una caída de VIP, es importante comprender primero la arquitectura básica del VIP. La figura de esta sección muestra el diagrama de bloques funcionales del VIP2, que incluye estos componentes:
Orion redujo la CPU del conjunto de instrucciones (RISC) y el circuito asociado, que incluye RAM dinámica (DRAM), caché L2, circuito integrado específico de la aplicación RENO (ASIC) y ROM de inicio.
CyBus ASIC: el componente que controla y transfiere paquetes entre la RAM estática (SRAM) VIP2 y la memoria de paquetes del sistema (MEMD) a través de CyBus o CxBus.
ASIC de memoria de paquete: responsable del traslado de paquetes entre adaptadores de puerto y SRAM.
Bus de interconexión de componentes periféricos (PCI): rutas de datos entre los adaptadores de puerto y la SRAM VIP2.
Puentes: responsable de aislar los buses PCI individuales de los adaptadores de puerto.
El microcódigo VIP2 (firmware) es una imagen que proporciona instrucciones de software específicas de la tarjeta. Un dispositivo de memoria de sólo lectura (PROM) programable en el VIP2 contiene una imagen de inicio de microcódigo predeterminada que ayuda al sistema a encontrar y cargar la imagen de microcódigo del paquete de software Cisco IOS® o de la memoria Flash. La imagen de reinicio de microcódigo en el PROM inicializa el VIP2 y entonces contribuye descargando la imagen del microcódigo VIP2. Todas las interfaces del mismo tipo cargan la misma imagen de microcódigo desde el grupo de software del IOS de Cisco o desde la memoria Flash. Pese a que la memoria Flash puede almacenar múltiples versiones de microcode para un tipo de interfaz específico, sólo una imagen puede cargarse al iniciar.
El comando show controllers cbus muestra la versión de microcódigo actualmente cargada y en ejecución para cada procesador de interfaz y el VIP2. El comando show startup-config muestra las instrucciones actuales del sistema para la carga de microcódigo durante el inicio.
Cuando resuelva problemas, puede utilizar la figura de esta sección como guía para leer información de un archivo crashinfo VIP o del registro del sistema. A modo de ejemplo, observe este resultado de syslog que muestra que se encuentra una paridad incorrecta cuando se lee desde la SRAM VIP:
Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error !--- Bad parity is found when read from the VIP SRAM. Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
Como puede ver en las recomendaciones de la siguiente sección, el VIP en esta salida debe ser monitoreado, y el SRAM o VIP debe ser reemplazado si ocurren caídas similares.
Puede verificar el contenido de la dirección 0x21 en EEPROM en el resultado del comando show diag para verificar el modelo de un VIP. Los valores que corresponden a cada tipo VIP se muestran en esta tabla:
Valor | VIP | Tipo de controlador |
---|---|---|
0x14 | VIP1 | Controlador VIP |
0x15 | VIP2 (VIP2-10, VIP2-15, VIP2-20, VIP2-40) | controlador VIP2 |
0x1E | VIP2-50 | Controlador VIP2 R5K |
0x20 | FEIP2 | Controlador FEIP2 |
0x21 | GEIP | controlador GEIP |
0x40 | GEIP +* | controlador GEIP+ |
0x22 | VIP4-80 | Controlador VIP4-80 RM7000 |
0x31 | VIP 4-50 | Controlador VIP4-50 RM5271 |
0x4E | VIP6-80 | controlador VIP6-80 RM7000B |
Nota: El GEIP+ se basa en el VIP4-80. Toda la información adicional en este documento sobre el VIP4-80 también se aplica al GEIP+.
Aquí tiene un ejemplo:
Router#show diag 10 Slot 10: Physical slot 10, ~physical slot 0x5, logical slot 10, CBus 0 Microcode Status 0x4 Master Enable, LED, WCS Loaded Board is analyzed Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision D0 Serial number: 17090200 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 01 04 C6 98 49 08 77 05 00 00 00 00 0x30: 68 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x4 Insertion time: 0x18C0 (00:29:13 ago) Controller Memory Size: 32 MBytes DRAM, 4096 KBytes SRAM
En esta salida puede ver que este VIP es un VIP2-50.
La diferencia entre un VIP2-10, VIP2-15, VIP2-20 y un VIP2-40 es la cantidad de DRAM y SRAM presente en cada uno. Los diversos VIP2s (si no se han actualizado) se pueden distinguir en la salida del comando show diag por las configuraciones de memoria que se muestran en esta tabla:
Memoria | VIP |
---|---|
8 MB DRAM/512 KB SRAM | VIP2-10 |
8 MB DRAM/1 MB SRAM | VIP2-15 |
16 MB DRAM/1 MB SRAM | VIP6-20 |
32 MB DRAM/2 MB SRAM | VIP 2-40 |
La información contenida en el archivo crashinfo puede resultar inestimable cuando intenta resolver problemas de software o intenta diagnosticar la causa subyacente de caídas del sistema. El archivo crashinfo no sólo contiene información de registro y una referencia de la pila para el VIP, sino que también contiene la memoria extensiva y la información de contexto. Cada vez que un VIP sufre una caída, éste intenta escribir un archivo crashinfo en la memoria flash de inicialización del RSP. Los archivos Crashinfo se almacenan en este formato:
crashinfo_vip_<slot#>_<data>_<time>
Puede ejecutar el comando dir para localizar los archivos crashinfo VIP como se muestra aquí:
7500a#dir bootflash: Directory of bootflash:/ 1 -rw- 3951876 Jan 01 2000 00:01:22 rsp-boot-mz.111-22.CA 2 -rw- 162641 Jun 21 2000 12:53:40 crashinfo_vip_0_20000621-125340 3 -rw- 162778 Jun 21 2000 13:00:10 crashinfo_vip_0_20000621-130010 7602176 bytes total (3324492 bytes free) 7500a#
Esta memoria flash de inicialización del router contiene dos archivos crashinfo VIP. Ejecute los comandos show file o more para ver y capturar el contenido de estos archivos de acuerdo con este procedimiento:
Comience el registro con su programa para terminal.
Ejecute el comando term length 0.
Ejecute el comando more bootflash:<crashinfo filename>.
Guarde el resultado en un archivo.
Refiérase a Recuperación de Información del Archivo Crashinfo para obtener más información sobre cómo trabajar con archivos crashinfo.
Si tiene el resultado de un comando show technical-support (from enable mode) de su dispositivo Cisco, puede utilizar para mostrar posibles problemas y soluciones. Debe ser un cliente registrado, haber iniciado sesión y tener JavaScript habilitado para utilizar .
Los desperfectos de VIP se clasifican en varias categorías según la causa del desperfecto. Cada vez que se encuentra un error no recuperable, el VIP se bloquea. Estos errores pueden ser el resultado de errores de paridad, software o hardware que provocan que un mensaje de reconocimiento negativo (NACK) esté presente en CyBus o problemas de software. Esta sección proporciona información sobre cada uno de estos tipos de error.
Si tiene el resultado de un comando show technical-support (from enable mode) de su dispositivo Cisco, puede utilizar para mostrar posibles problemas y soluciones. Debe ser un cliente registrado, haber iniciado sesión y tener JavaScript habilitado para utilizar .
Ocurren errores de paridad en un VIP cuando el hardware intenta controlar la validez de los datos mediante la comparación de los valores de paridad calculados con valores de paridad anteriores para los mismos datos. Una única rotación de bits en los datos puede causar un error de paridad. Cuando diagnostica errores de paridad en un VIP, es importante comprender cada ubicación en la que se verifica la paridad y en la que pueden ocurrir potencialmente errores de paridad. Este diagrama describe esta información. Además, consulte Cisco 7500 VIP Fault Tree Analysis para obtener más información sobre los errores de paridad.
Como se muestra en este diagrama, hay siete tipos diferentes de errores de paridad que pueden ocurrir en un VIP. Tenga en cuenta que los errores se pueden recibir de otro origen y es posible que no se hayan originado dentro del propio VIP. El origen del error de paridad puede provenir del procesador de routing/switch (RSP), otro VIP o de adaptadores de puerto defectuosos o mal instalados. Para entender correctamente un desperfecto de VIP, es importante diagnosticar el origen del desperfecto.
También es importante comprender que los datos con paridad incorrecta pueden ser notificados por varios de los dispositivos de verificación de paridad en el router de las series VIP y Cisco 7500 para cualquier operación de lectura o escritura única. Por ejemplo, si el VIP lee un paquete en una cola de transmisión en el RSP en su propia SRAM y hay un error de paridad en la SRAM del RSP, entonces verá mensajes de error del MD ASIC en el RSP, el CYA ASIC en el VIP y también el PCI/Packet Memory ASIC en el VIP.
Este diagrama muestra el análisis del árbol de fallas para los desperfectos VIP:
Los VIP4-50, VIP4-80 y VIP6-80 utilizan corrección de errores de un solo bit y corrección de código de error de detección de error de doble bit (ECC) para memoria de la CPU y memoria de paquetes. Ambos son RAM dinámica sincrónica (SDRAM). Se corrige un único error de bit en SDRAM y el sistema continúa funcionando normalmente.
Los errores de paridad multibit en los números 2 ó 3 de esta tabla son un evento fatal que causa errores de multibit ECC. El caché interno de la CPU y los bus en el sistema utilizan la detección de paridad de un solo bit. Como se muestra aquí, la arquitectura de VIP4 y VIP6 es diferente a la de VIP2. Por lo tanto, algunos mensajes de error no se ven y otros mensajes de error se informan de manera diferente que en el VIP2. En esta sección de error de paridad, se indican y explican las diferencias entre el VIP2, el VIP4 y el VIP6.
Las excepciones de error de paridad de caché se producen cuando se detecta una paridad incorrecta en la CPU o en la memoria caché de datos principal. El error de paridad puede haber ocurrido en la DRAM VIP, el controlador DRAM, la memoria caché primaria o en la CPU misma. También se hace referencia a los errores de paridad descubiertos en esta ubicación como errores de paridad de la memoria del procesador (PMPE). Estos errores provocan un desperfecto inmediato del VIP y el resultado es similar tanto en los VIP como en los RSP. Un valor sig de veinte (sig=20) indica que ha acontecido una excepción de error de paridad de la memoria caché. El valor sig se muestra en los mensajes de registro del sistema para la falla.
El código reciente también proporciona una línea detallada significativa, como se muestra aquí:
Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System reloaded by a Cache Parity Exception Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System Reload called from 0x60125C8C, context=0x60220930 Oct 21 00:11:14.913: %VIP2-1-MSG: slot0 System exception: sig=20, code=0x20025B69, context=0x60220930
La información incluida en el archivo de información de desperfecto de VIP también indica la misma ubicación del error de paridad en la memoria caché de datos principal:
Error: primary data cache, fields: data, virtual addr 0x6058A000, physical addr(21:3) 0x18A000, vAddr(14:12) 0x2000 virtual address corresponds to main:data, cache word 0 Low Data High Data Par Low Data High Data Par L1 Data : 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8 Low Data High Data Par Low Data High Data Par Mem Data: 0:0xFEFFFEFE 0x65776179 0x13 1:0x20536572 0x76657220 0x89 2:0x646F6573 0x206E6F74 0x9C 3:0x20737570 0x706F7274 0xF8
Un caché primario o PMPE puede ser un error transitorio. Si ésta es la primera instancia de un PMPE, normalmente puede ignorarlo de forma segura. Sin embargo, si la misma VIP experimenta un segundo o más PMPE, debería reemplazar la VIP. A veces, la sustitución de la DRAM en sí misma también puede resolver el problema.
Nota VIP4 y VIP6: los errores de paridad que se producen en la memoria caché interna de la CPU y en CyAsic se detectan como excepciones de error de paridad de la memoria caché. Los simples errores de paridad de bit en la memoria de la CPU son corregidos y no se necesita seguir ninguna acción. Los errores de paridad de bits múltiples en la memoria de la CPU se detectan como un error de paridad procmem ecc multi-bit. Si se informa el error procmem ecc multi-bit parity, se debe reemplazar la memoria de la CPU en el VIP.
Oct 25 09:30:54.708: %VIP4-50 RM5271-1-MSG: slot4 PMA error register1 00000000 00002000 Oct 25 09:30:54.716: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit error Oct 25 09:30:54.724: %VIP4-50 RM5271-1-MSG: slot4 PCI1 master address 00000000 Oct 25 09:30:54.732: %VIP4-50 RM5271-1-MSG: slot4 PCI1 slave address 00000000 Oct 25 09:30:54.740: %VIP4-50 RM5271-1-MSG: slot4 Latched Addresses Oct 25 09:30:54.748: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception addr 22220000 025F0860 Oct 25 09:30:54.756: %VIP4-50 RM5271-1-MSG: slot4 Procmem ECC multi-bit exception data 00000000 00000000 Oct 25 09:30:54.764: %VIP4-50 RM5271-1-MSG: slot4 MPU addr exception/WPE address 00000000 00000000 Oct 25 09:30:54.772: %VIP4-50 RM5271-1-MSG: slot4 MPU WPE addr/WPE data 00000000 00000000 Oct 25 09:30:54.780: %VIP4-50 RM5271-1-MSG: slot4 ProcMem addr exception 0 0000000 Oct 25 09:30:54.788: %VIP4-50 RM5271-1-MSG: slot4 Pakmem addr exception 00000000 Oct 25 09:31:15.824: %VIP4-50 RM5271-1-MSG: slot4 System reloaded by a fatal hardware error Oct 25 09:31:15.836: %VIP4-50 RM5271-1-MSG: slot4 caller=0x600BCE18 Oct 25 09:31:15.844: %VIP4-50 RM5271-1-MSG: slot4 System exception: sig22, code 0x0, context=0x60615F28
Cuando se descarga un VIP del MEMD en el RSP y se ven estos errores, esto generalmente indica que otro VIP ha escrito una paridad incorrecta en el MEMD o que el MEMD se ha dañado. Si el origen es del MEMD y continúa, debe reemplazar el RSP. Por el contrario, si el origen de la paridad incorrecta es otro VIP, debe volver a instalarse y, si es necesario, reemplazar el VIP que escribe la paridad incorrecta.
%VIP2-1-MSG: slot1 Nevada Error Interrupt Register 0x3 %VIP2-1-MSG: slot1 CYASIC Error Interrupt register 0x2020000C %VIP2-1-MSG: slot1 Parity Error internal to CYA %VIP2-1-MSG: slot1 Parity Error in data from CyBus !--- Bad parity is received by the VIP from the CyBus. %VIP2-1-MSG: slot1 CYASIC Other Interrupt register 0x200100 %VIP2-1-MSG: slot1 QE HIGH Priority Interrupt %VIP2-1-MSG: slot1 CYBUS Error register 0xD001A02, PKT Bus Error register 0x0 %VIP2-1-MSG: slot1 PMA error register = 0070000440000000 %VIP2-1-MSG: slot1 Packet Bus Write Parity error !--- The bad parity that was received from the CyBus is written to SRAM. %VIP2-1-MSG: slot1 PCI master address = 0700004 %VIP2-1-MSG: slot1 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 %VIP2-1-MSG: slot1 DEC21050 bridge chip, config=0x0 %VIP2-1-MSG: slot1 (0x00): cfid = 0x00011011 %VIP2-1-MSG: slot1 (0x04): cfcs= 0x02800147 %VIP2-1-MSG: slot1 (0x08):cfccid = 0x06040002 %VIP2-1-MSG: slot1 (0x0C):cfpmlt = 0x00010000 %VIP2-1-MSG: slot1 (0x18): cfsmlt = 0x00010100 %VIP2-1-MSG: slot1 (0x1C): cfsis = 0x22807020 %VIP2-1-MSG: slot1 Received Master Abort on secondary bus %VIP2-1-MSG: slot1 (0x20): cfmla = 0x01F00000
Nota: VIP4 y VIP6 muestran los mismos mensajes de error sobre el error de paridad CyBus, pero el mensaje de error packet bus write parity no se muestra.
ASIC RENO detecta tanto los errores de paridad del controlador de DRAM como los del controlador de Entrada/Salida (I/O). Un error de paridad que se origina en la DRAM o en el controlador DRAM se informa como una excepción de paridad de la memoria caché. Se informa de un error de paridad detectado por el controlador de E/S, como se muestra en este resultado. A menudo, los errores de paridad informados por el controlador I/O se han originado en alguna otra parte y son informados por el controlador I/O y a través de los mensajes desde otras ubicaciones.
Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Reno read parity error - bytes 0 & 1 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 PMA error register = 0080004000001000 Feb 17 23:03:04 cst: %VIP2 R5K-1-MSG: slot0 Packet Memory Read Parity error
Nota: VIP4 y VIP6 no muestran este mensaje de error.
El ASIC de PMA informa un error de paridad de lectura de la memoria de paquete cada vez que el error de paridad se extrae mediante lectura de la memoria de paquete (SRAM) en el VIP. Este error se informa en el registro del sistema como se muestra aquí:
Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 Nevada Error Interrupt Register = 0x22 Oct 30 05:18:06.120: %VIP2-1-MSG: slot9 PCI bus 0 parity error Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PMA error register = 4080103C00004000 Oct 30 05:18:07.120: %VIP2-1-MSG: slot9 PCI Transmit Parity error Oct 30 05:18:08.120: %VIP2-1-MSG: slot9 Packet Memory Read Parity error
También podemos ver evidencia de un error de paridad de lectura de la memoria del paquete en el archivo crashinfo del VIP:
Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000
Los errores de paridad SRAM también pueden ser transitorios, por lo que trate la primera aparición de la misma manera que los errores de paridad DRAM. Si continúan los errores, reemplace el SRAM o el VIP.
Nota VIP4 y VIP6: se corrigen los errores de paridad de un solo bit en la memoria del paquete. Los errores de paridad de bits múltiples en la memoria del paquete se detectan como un error de paridad de bits múltiples de ecc pakmem. La memoria de paquetes VIP debería reemplazarse si se registra un error pakmem ecc de paridad de bit múltiple.
%VIP4-80 RM7000-1-MSG: slot1 PMA error register0 = 0000000000002000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit error %VIP4-80 RM7000-1-MSG: slot1 PCI0 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI0 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PMA error register1 = 0000000000000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 master address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 PCI1 slave address = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Latched Addresses %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception addr = 00012358 000000CA %VIP4-80 RM7000-1-MSG: slot1 Pakmem ECC multi-bit exception data = 00000000 00040800 %VIP4-80 RM7000-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 %VIP4-80 RM7000-1-MSG: slot1 ProcMem addr exception = 00000000 %VIP4-80 RM7000-1-MSG: slot1 Pakmem addr exception = 00000000
El ASIC PMA informa un error de paridad de escritura en bus de paquetes siempre que se escribe un error de paridad en la memoria de paquete. En este ejemplo, el VIP es sólo el mensajero y el problema no existe con la memoria de este VIP.
May 10 09:22:14.520: %VIP2-1-MSG: slot11 PMA error register = 2080002800800200 May 10 09:22:15.520: %VIP2-1-MSG: slot11 Packet Bus Write Parity error
Nota: VIP4 y VIP6 no muestran este mensaje de error.
Pueden detectarse los errores de paridad en los bus 1 y 2 PCI, que conectan directamente la interfaz con los adaptadores de puerto. Estos buses están conectados en puente por un tercer bus PCI, bus 0, en el cual los errores de paridad pueden también detectarse. Los errores de paridad que se originan en cualquiera de los buses PCI son causados comúnmente por adaptadores de puerto mal instalados o defectuosos. Cada vez que vea estos mensajes en el resultado de syslog de un desperfecto de VIP, debe volver a acomodar el adaptador de puerto para resolver el problema.
PCI bus <num> parity error PCI bus <num> system error Detected Parity Error on secondary bus
Si el restablecimiento del adaptador de puerto no resuelve el problema, el problema reside en el adaptador de puerto o en el VIP. Mueva el adaptador de puerto a otra bahía e inserte un segundo adaptador de puerto en la bahía original para resolver problemas. Esto por lo general señala el hardware agresor. Un ejemplo se muestra aquí:
Mar 16 19:34:54: %GEIP-1-MSG: slot9 Nevada Error Interrupt Register = 0x6 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI bus 0 system error Mar 16 19:34:54: %GEIP-1-MSG: slot9 PMA error register = 0080043800100000 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI IRDY time-out Mar 16 19:34:54: %GEIP-1-MSG: slot9 PCI master address = 0800438 Mar 16 19:34:54: %GEIP-1-MSG: slot9 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0
Nota: Los mismos errores ocurren con el VIP4 y el VIP6, pero el mensaje de error es diferente. Se detecta como un error de paridad maestra PCI y un error de paridad esclava PCI. Realice los mismos pasos descritos para los errores de paridad de bus PCI VIP para solucionar este problema.
00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register0 = 0000000001800000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Master Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI Slave Parity error 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI0 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PMA error register1 = 0000000000000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 master address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 PCI1 slave address = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Latched Addresses 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU addr exception/WPE address = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 MPU WPE addr/WPE data = 00000000 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 ProcMem addr exception = 00000000 00:00:44: %VIP4-50 RM5271-1-MSG: slot1 Pakmem addr exception = 00000000
El VIP también puede detectar errores de paridad en los datos o la dirección de una operación de lectura o escritura en CyBus. Si esto ocurre, verá un resultado de syslog similar a este:
CYASIC Error Interrupt register 0x2020000C Parity Error internal to CYA Parity Error in data from CyBus
Utilice esta información junto con la información presente en los registros del sistema para determinar la verdadera fuente del error.
Nota: El VIP4 y el VIP6 muestran los mismos mensajes de error para los errores de paridad de CyBus.
Cuando VIP intenta escribir a una dirección no válida en MEMD, RSP coloca un NACK en CyBus para esa ranura. Esto suele ser un problema de software, pero también puede ser un problema de hardware. Por ejemplo, en este resultado, el VIP escribe 4 bytes en una dirección no válida, por lo que el RSP coloca un NACK en el CyBus para esa ranura.
%RSP-3-ERROR: CyBus0 error 10 %RSP-3-ERROR: command/address mismatch %RSP-3-ERROR: bus command write 4bytes (0xE) %RSP-3-ERROR: address offset (bits 3:1) 0 %RSP-3-ERROR: virtual address (bits 23:17) 000000 %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20000003 %VIP2-1-MSG: slot5 Missing ACK on CyBus access %VIP2-1-MSG: slot5 NACK present on CyBus access %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x0 %VIP2-1-MSG: slot5 CYBUS Error register 0x8001C48, PKT Bus Error register 0x0 %VIP2-1-MSG: slot5 System reloaded by a fatal hardware error %VIP2-1-MSG: slot5 caller=0x60126C44 %VIP2-1-MSG: slot5 System exception: sig=22, code=0x0, context=0x60265C68
Sin embargo, como se muestra en este resultado, el RSP también coloca un NACK en un VIP para intentar escribir paridad incorrecta en el MEMD.
CYASIC Error Interrupt register 0x1B Parity Error in data from Packet Bus Parity Error internal to CYA Missing ACK on CyBus access NACK present on CyBus access
Cuando aparece un NACK en todas las ranuras, como se muestra en esta salida, se trata de un error de hardware. El árbitro posee fallas y la caja de la tarjeta debe reemplazarse.
Jan 1 23:55:21: %FEIP2-1-MSG: slot0 Nevada Error Interrupt Register =0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Error Interrupt register0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot0 CYBUS Error register 0x8001A00, PKTBus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %VIP2-1-MSG: slot2 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 CYBUS Error register 0x800006A, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot5 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Error Interrupt register 0x20200001 Jan 1 23:55:21: %VIP2-1-MSG: slot5 NACK present on CyBus access Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYASIC Other Interrupt register 0x200000 Jan 1 23:55:21: %VIP2-1-MSG: slot5 CYBUS Error register 0x800006C, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot8 CYBUS Error register 0x8001B80, PKT Bus Error register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 Nevada Error Interrupt Register = 0x1 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Error Interrupt register 0x20000001 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 NACK present on CyBus access Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYASIC Other Interrupt register 0x0 Jan 1 23:55:21: %FEIP2-1-MSG: slot10 CYBUS Error register 0x8001C08, PKT Bus Error register 0x0 Jan 1 23:55:21: %VIP2-1-MSG: slot2 System reloaded by a fatal hardware error Jan 1 23:55:21: %VIP2-1-MSG: slot2 caller=0x6012640C Jan 1 23:55:21: %VIP2-1-MSG: slot2 System exception: sig=22, code=0x0, context=0x60265028
Los desperfectos de VIP no causados por ninguna de las razones en este documento se deben normalmente a otros problemas de software. Estos desperfectos se pueden manifestar de muchas maneras diferentes. Estas son sugerencias generales para reducir el riesgo de desperfectos de VIP debido a problemas de software y para lidiar con ellos si se producen:
Asegúrese siempre de que la imagen del software Cisco IOS sea compatible con el VIP.
Siempre mantenga la imagen RSP-BOOT y la imagen de software Cisco IOS en la misma versión.
Asegúrese de que la versión actual del software del IOS de Cisco admite la configuración VIP y el adaptador de puerto.
Verifique las notas de la versión para el nivel correcto del software del Cisco IOS y los requerimientos de memoria.
Este es un ejemplo del resultado de un registro del sistema de un desperfecto de VIP debido a un problema de software:
Apr 18 17:13:33.884: %VIP2 R5K-1-MSG: slot0 System reloaded by a Bus Error exception Apr 18 17:13:33.892: %VIP2 R5K-1-MSG: slot0 caller=0x600BC974 Apr 18 17:13:33.900: %VIP2 R5K-1-MSG: slot0 System exception: sig=10, code=0x408, context=0x605B51E0 Apr 18 17:13:33.912: %VIP2 R5K-1-MSG: slot0 $0 : 00000000, AT : 605B0000, v0 : 00000001, v1 : FFFFFFFC, Apr 18 17:13:33.924: %VIP2 R5K-1-MSG: slot0 a0 : 00000002, a1 : 6042CEE0, a2 : 00000000, a3 : 6112FEC4, Apr 18 17:13:33.936: %VIP2 R5K-1-MSG: slot0 t0 : 00000053, t1 : 3400FF01, t2 : 00000000, t3 : FFFFFFFF, Apr 18 17:13:33.948: %VIP2 R5K-1-MSG: slot0 t4 : 600BC9B0, t5 : 000000F8, t6 : 00000000, t7 : 00000002, Apr 18 17:13:33.956: %VIP2 R5K-1-MSG: slot0 s0 : 0C58BA24, s1 : 00000064, s2 : 6112C7AC, s3 : 60560000, Apr 18 17:13:33.964: %VIP2 R5K-1-MSG: slot0 s4 : 60560000, s5 : 00000001, s6 : 6041433C, s7 : 60414310, Apr 18 17:13:33.972: %VIP2 R5K-1-MSG: slot0 t8 : 00008945, t9 : 00000000, k0 : 607F6CA0, k1 : 00000200, Apr 18 17:13:33.980: %VIP2 R5K-1-MSG: slot0 gp : 6056AFC0, sp : 6112FEC0, s8 : 60414460, ra : 6026EC4C, Apr 18 17:13:33.988: %VIP2 R5K-1-MSG: slot0 EPC : 6026EAA0, ErrorEPC : 800086B8, SREG : 3400FF03 Apr 18 17:13:33.996: %VIP2 R5K-1-MSG: slot0 Cause 00000408 (Code 0x2) Apr 18 17:13:34.004: %VIP2 R5K-1-MSG: slot0 Traceback= 6026EAA0 6026E2E8 6009BAF4 6009BAE0 Apr 18 17:13:35.012: %DBUS-3-DBUSINTERRSWSET: Slot 0, Internal Error due to VIP crash
Posiblemente la información más importante que debe obtener en caso de un problema de software es el archivo crashinfo para el VIP. Consulte la sección Obtain a VIP Crashinfo File para obtener instrucciones para capturar esta información.
El VIP se bloquea muchas veces y cuando revisa el archivo de información de desperfecto, puede ver este mensaje:
00:00:11: %LINK-3-UPDOWN: Interface POS1/0, changed state to up IOBUS Error Interrupt Status register 0x0 Unexpected exception, CPU signal 10, PC = 0x602A7660 -Traceback= 602A7660 602AB238
El mensaje de error CPU signal 10 significa error de excepción de bus. Los errores de bus pueden ser problemas de software o hardware. La solución temporal para este problema es volver a colocar el módulo y monitorear el router. Si el módulo se desmorona después de reiniciar el módulo, póngase en contacto con la herramienta TAC Case Open (sólo clientes registrados) con el archivo de información de desperfecto.
Es una buena idea crear un archivo de resumen de desperfectos de VIP con esta información antes de abrir un caso. Incluya esta información en el campo Descripción del problema de la herramienta TAC Case Open (sólo clientes registrados).
Descripción de problemas
Salida del comando show version
Salida del comando show diag slot [x]
Extracto del archivo Crashinfo
Fragmento de Syslog
Luego, recopile la información para recopilar si abre un caso TAC.
Este es un ejemplo de un archivo de resumen de desperfecto:
******problem description.. VIP crashed with parity errors. The parity errors are being read by the SRAM, suspect the PA! ******show version Cisco Internetwork Operating System Software IOS (tm) GS Software (RSP-PV-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) V111_29_CC_THROTTLE_BRANCH Synced to mainline version: 11.1(29)CA Copyright (c) 1986-1999 by cisco Systems, Inc. Compiled Wed 13-Oct-99 02:21 by sharpd Image text-base: 0x60010910, data-base: 0x60832000 ROM: System Bootstrap, Version 11.1(8)CA1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) ROM: GS Software (RSP-BOOT-M), Version 11.1(29)CC1, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) attga711c7 uptime is 27 weeks, 11 minutes System restarted by reload at 00:49:05 UTC Sun Oct 24 1999 System image file is "slot0:rsp-pv-mz.111-29.CC1", booted via slot0 Host configuration file is "cbb/al/ar-2", booted via tftp from 199.37.184.170 cisco RSP4 (R5000) processor with 262144K/2072K bytes of memory. R5000 processor, Implementation 35, Revision 2.1 (512KB Level 2 Cache) Last reset from power-on G.703/E1 software, Version 1.0. G.703/JT2 software, Version 1.0. X.25 software, Version 2.0, NET2, BFE and GOSIP compliant. Chassis Interface. 3 VIP2 R5K controllers (3 ATM). 3 ATM network interfaces. 123K bytes of non-volatile configuration memory. 20480K bytes of Flash PCMCIA card at slot 0 (Sector size 128K). 8192K bytes of Flash internal SIMM (Sector size 256K). ******show diag slot 6 Slot 6: Physical slot 6, ~physical slot 0x9, logical slot 0, CBus 0 Microcode Status 0x4 WCS Loaded Board is disabled analyzed wedged Pending I/O Status: None EEPROM format version 1 VIP2 R5K controller, HW rev 2.02, board revision C0 Serial number: 12639078 Part number: 73-2167-05 Test history: 0x00 RMA number: 00-00-00 Flags: cisco 7000 board; 7500 compatible EEPROM contents (hex): 0x20: 01 1E 02 02 00 C0 DB 66 49 08 77 05 00 00 00 00 0x30: 60 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 Slot database information: Flags: 0x295 Insertion time: 0x3AA4 (27w0d ago) Controller Memory Size: 128 MBytes DRAM, 8192 KBytes SRAM PA Bay 0 Information: ENHANCED ATM OC3 PA (MM), 1 port EEPROM format version 1 HW rev 2.00, Board revision A0 Serial number: 12366362 Part number: 73-2430-04 1 crash since restart. Last crash context (Apr 29 2000 23:19:26): Nevada Error Interrupt Register = 0x2 PMA error interrupt PMA Error Register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 $0 : 00000000, AT : 60179244, v0 : 601D337C, v1 : 0000AAAA a0 : 604CF3E0, a1 : 604C8180, a2 : 00001182, a3 : 00000050 t0 : 00000800, t1 : 4E90424C, t2 : 00000001, t3 : 6014A620 t4 : 6016E220, t5 : 000000F8, t6 : 00000000, t7 : 00000000 s0 : 321735CC, s1 : 6052B508, s2 : 604C8180, s3 : 604CF3E0 s4 : 3226C120, s5 : 604D1440, s6 : 00000002, s7 : 00000CED t8 : 34000000, t9 : 603C9930, k0 : 00000000, k1 : 00000002 gp : 60337700, sp : 603C0350, s8 : 00000001, ra : 601476E8 EPC : 601D337C, ErrorEPC : 800086B8, SREG : 3400E103 Cause 00000000 (Code 0x0): Interrupt exception Traceback= 0x601D337C 0x601476E8 0x6014A674 ******excerpt from crashinfo Nevada Error Interrupt Register = 0x2 PMA error register = 0046000000001000 Packet Memory Read Parity error PCI master address = 0460000 ******excerpt from syslog Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Nevada Error Interrupt Register = 0x2 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PMA error register = 0046000000001000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 Packet Memory Read Parity error Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PCI master address = 0460000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 PA Bay 0 Upstream PCI-PCI Bridge, Handle=0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 DEC21050 bridge chip, config=0x0 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x00): cfid = 0x00011011 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x04): cfcs = 0x02800147 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x08): cfccid = 0x06040002 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x0C): cfpmlt = 0x00010000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x18): cfsmlt = 0x00010100 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x1C): cfsis = 0x02807020 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x20): cfmla = 0x01F00000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x24): cfpmla = 0x0000FE00 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x3C): cfbc = 0x00030000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x40): cfseed = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x44): cfstwt = 0x00000000 Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x48): cfswac = 0x00FFFFFF Apr 29 23:19:13: %VIP2 R5K-1-MSG: slot6 (0x4C): cfpwac = 0x00FFFFFF Apr 29 23:19:26: %VIP2 R5K-1-MSG: slot6 System reloaded by a fatal hardware error
Si todavía necesita ayuda después de realizar los pasos de solución de problemas de este documento y desea abrir un caso con el Soporte Técnico de Cisco, asegúrese de incluir esta información: |
---|
Nota: Si es posible, no recargue ni apague manualmente el router antes de recopilar esta información, ya que esto puede hacer que se pierda información importante necesaria para determinar la causa raíz del problema. |
Revisión | Fecha de publicación | Comentarios |
---|---|---|
1.0 |
02-Oct-2006 |
Versión inicial |