이 문서에서는 %SYS-3-CPUHOG 오류 메시지의 원인을 나열하고 문제 해결 방법을 설명합니다.
이 문서에 대한 특정 요건이 없습니다.
이 문서는 특정 소프트웨어 및 하드웨어 버전으로 한정되지 않습니다.
이 문서의 정보는 특정 랩 환경의 디바이스를 토대로 작성되었습니다. 이 문서에 사용된 모든 디바이스는 초기화된(기본) 컨피그레이션으로 시작되었습니다. 현재 네트워크가 작동 중인 경우, 모든 명령어의 잠재적인 영향을 미리 숙지하시기 바랍니다.
문서 규칙에 대한 자세한 내용은 Cisco 기술 팁 표기 규칙을 참조하십시오.
Cisco IOS® 소프트웨어는 런어웨이 프로세스의 영향을 줄이기 위해 스케줄러가 현재 활성화된 프로세스를 주기적으로 폴링할 수 있도록 하는 프로세스 워치독 타이머를 사용합니다. 이 기능은 선점과 동일하지 않습니다. 그 대신, 이는 페일 세이프(fail-safe) 메커니즘으로, 어떤 프로세스에서도 CPU가 총 소모되어 시스템이 응답하지 않거나 완전히 잠기지 않도록 보장합니다.
프로세스가 중단된 것(예: 장시간 실행되는 경우)으로 나타나면 스케줄러는 프로세스를 강제로 종료할 수 있습니다.
스케줄러는 프로세스가 CPU에서 실행되도록 허용할 때마다 해당 프로세스에 대한 watchdog 타이머를 시작합니다. 미리 설정된 기간 후 프로세스가 계속 실행되면 Watchdog 프로세스가 인터럽트를 생성하고 "소프트웨어 강제 크래시"에 의해 라우터를 다시 시작합니다. 스택 추적에서는 Watchdog 프로세스를 크래시의 트리거로 표시합니다.
감시기가 처음으로 만료되면 스케줄러는 다음과 같은 경고 메시지를 인쇄합니다.
%SYS-3-CPUHOG: Task ran for 2148 msec (20/13), Process = IP Input, PC = 3199482 -Traceback= 314B5E6 319948A
이 메시지는 프로세스가 CPU를 지연시켰음을 나타냅니다. 여기에서는 "IP 입력" 프로세스입니다. 이 메시지는 일반적으로 라우터가 부팅할 때 OIR(Online Insertion and Removal)과 같은 일시적인 상황에서 또는 트래픽이 많은 상황에서 나타납니다. 라우터가 정상적으로 작동하는 동안에는 "%SYS-3-CPUHOG" 메시지가 표시되지 않아야 합니다.
프로세스가 실행되도록 예약된 후 라우터가 인터럽트 레벨에서 사용 중인 경우 프로세스가 실행된 기간의 계산이 부정확해질 수 있습니다. 이는 CPUHOG가 프로세스 수준 작업만 추적하기 때문입니다. CPU를 중단 및 제어할 수 있는 인터럽트 레벨 작업은 추적하지 않습니다.
인터럽트 레벨에서 실행하는 일반적인 프로세스는 패킷 스위칭입니다.
이 섹션에서는 다양한 시나리오에서 CPUHOG 메시지를 트러블슈팅하는 방법에 대해 설명합니다.
부팅 시퀀스 시 CPUHOG 메시지는 매우 일반적입니다. 오류 메시지 자체는 부팅 프로세스가 CPU를 시스템에서 보유하고자 하는 시간보다 조금 더 길게 보유했음을 의미하며, 그런 다음 콘솔 출력에 메시지를 보내 사용자에게 알립니다. 이 경우 프로세스는 CPUHOG가 발생한 위치를 나타내는 "Boot Load(부팅 로드)"입니다.
System Bootstrap, Version 11.1(12)XA, EARLY DEPLOYMENT RELEASE SOFTWARE (fc1) Copyright (c) 1997 by cisco Systems, Inc. C1600 processor with 16384 Kbytes of main memory program load complete, entry point: 0x4018060, size: 0x108968 %SYS-3-CPUHOG: Task ran for 2040 msec (6/6), Process = Boot Load, PC =40B513A -Traceback= 407EB6E 407F628 407D118 40180E0 40005B0 4015C3E 40152B2 4014ED4 40025B8 4003086 4015636 40021A8 400C616program load complete, entry point: 0x2005000, size: 0x4195b9 Self decompressing the image : ############################################################################ ############################################################################ ################################################################## [OK]
이 오류 메시지를 안전하게 무시할 수 있습니다. 부트 프로세스 시 부트 로더는 CPU를 2~4초 동안 사용하고, 이를 해제하지 않는다. 이 문제는 부팅 시 문제가 되지 않습니다. CPU가 해당 시점에 부트 로더만 실행해야 하기 때문입니다. 최신 부트 ROM에서는 특정 메시지의 인쇄를 억제합니다.
또한 라우터가 큰 이미지를 로드할 때마다(예: Cisco 1600 Series 라우터 사용 시) 부팅 헬퍼 이미지에서 CPUHOG 메시지를 확인할 수 있습니다. 이 라우터는 16MB 이상의 DRAM으로 구성되어 있습니다.
이 메시지는 이미지가 로드되고 있을 때만 발생하며 시스템의 작동 또는 로드 프로세스에는 영향을 미치지 않습니다. 어쨌든, 이는 시스템의 정상적인 작동에 아무런 영향을 미치지 않으므로 외관상 문제이다.
CPUHOG 메시지는 라우터가 복잡하고 비교적 긴 작업을 수행해야 하기 때문에 OIR에서 일반적으로 발생합니다. OIR 중에 발생하는 CPUHOG 메시지는 삽입된 카드가 제대로 나오는 한 걱정할 필요가 없습니다.
CPUHOG 메시지는 플래시 디바이스(예: 플래시 카드 또는 Flash SIMM(Single Inline Memory Module))에 액세스하려고 할 때 디바이스에 결함이 있거나 디바이스가 응답하지 않을 때 나타날 수 있습니다. 문제가 다시 발생하면 TAC 담당자에게 문의하십시오.
참고: 통합 Cisco IOS 소프트웨어(기본 모드) 또는 하이브리드 모드를 실행하고 MSFC(RP) 부트플래시 포맷 시 CPUHOG 메시지가 있는 Catalyst 6500의 경우, Cisco IOS Software 릴리스 12.1.11b, 12.1(12c)E5 또는 12.1(13)E 이상에서 해결되는 Cisco 버그 ID CSCdw53175(등록된 고객만 해당) 및 이후 버전에서 언급된 문제일 수 있습니다.
Cisco 12000 Series Internet Router에서는 패킷 스위칭에 사용할 수 있도록 FIB(Forwarding Information Base)가 각 라인 카드에서 유지됩니다. FIB 트리의 구조로 인해 짧은 서브넷 마스크(/1~/4 사이)를 사용한 라우팅 변경으로 인해 콘솔 로그에 다음과 같은 메시지가 표시될 수 있습니다.
SLOT 1: %SYS-3-CPUHOG: Task ran for 4024 msec (690/0), process = CEF IPC Background, PC = 400B8908. -Traceback= 400B8910 408FF588 408FF6F4 408FFE8C 400A404C 400A4038
Cisco IOS 소프트웨어의 프로세스가 2000ms(2초) 이상 실행되면 CPUHOG 메시지가 표시됩니다. 매우 짧은 서브넷 마스크에 대한 CEF(Cisco Express Forwarding) 업데이트의 경우 필요한 처리 양이 2,000ms를 초과할 수 있으며, 이 경우 이러한 메시지가 트리거될 수 있습니다. "CEF IPC Background" 프로세스는 전달 트리에서 접두사의 추가 및 제거를 제어하는 상위 프로세스입니다.
또한 CPU가 장기간 잠기면 패브릭 Ping 실패로 인해 라인 카드가 중단되거나 IPC 통신 시간 초과로 인해 FIB가 비활성화될 수 있습니다. 이러한 문제를 해결해야 하는 경우 Cisco 12000 Series Internet Router에서 패브릭 Ping 시간 초과 및 장애 문제 해결을 참조하십시오.
일반적으로 /7보다 짧은 마스크의 라우팅 업데이트는 잘못되었거나 악의적입니다. Cisco에서는 모든 고객이 이러한 업데이트의 처리 및 전파를 방지하기 위해 적절한 경로 필터링을 구성하는 것을 권장합니다. 라우팅 필터 구성에 도움이 필요한 경우 기술 지원 담당자에게 문의하십시오.
BGP(Border Gateway Protocol) 또는 라우팅 테이블을 지울 때 "CEF IPC Background" 프로세스로 인해 CPUHOG 메시지가 트리거될 수도 있습니다.
대부분의 경우 이러한 오류 메시지는 Cisco IOS Software의 내부 소프트웨어 버그 때문입니다.
이러한 유형의 오류 메시지를 해결하기 위한 첫 번째 단계는 알려진 버그를 찾는 것입니다. 버그 툴킷(등록된 고객만)을 사용하여 오류와 일치하는 버그를 찾을 수 있습니다. Bug Toolkit(버그 툴킷) 페이지에서 Launch Bug Toolkit(버그 툴킷 실행)을 클릭하고 Search for Cisco IOS-related bugs(Cisco IOS 관련 버그 검색)를 선택합니다. 검색 범위를 좁히려면 1번 아래에서 Cisco IOS 소프트웨어 버전을 선택할 수 있습니다. 3번 아래에서 "CPUHOG, <process>"에 대한 키워드 검색을 수행할 수 있습니다. 여기서 process는 Virtual Exec 또는 IP 입력과 같은 해당 프로세스입니다.
릴리스 열차에서 최신 Cisco IOS 소프트웨어 이미지로 업그레이드하여 모든 고정 CPUHOG 버그를 제거할 수 있습니다.
위의 트러블슈팅 단계를 수행한 후에도 여전히 도움이 필요하며 Cisco TAC에 서비스 요청(등록된 고객만 해당)을 열려면 다음 정보를 포함해야 합니다. |
---|
참고: Cisco 12000 Series Internet Router에서 라인 카드 충돌을 해결하기 위해 필요한 경우가 아니면 위의 정보를 수집하기 전에 라우터를 수동으로 다시 로드하거나 전원을 껐다가 켜지 마십시오. 이렇게 하면 문제의 근본 원인을 파악하는 데 필요한 중요한 정보가 손실될 수 있습니다. |
개정 | 게시 날짜 | 의견 |
---|---|---|
1.0 |
24-Jun-2008 |
최초 릴리스 |