개정 | 날짜 | 설명 |
---|---|---|
1.2
|
2016년 5월 18일
|
영향 받는 제품, 문제 설명, 배경, 문제 증상 및 해결 방법/솔루션 섹션을 업데이트했습니다.CDETS 섹션을 추가했습니다.
|
1.1
|
2014년 12월 15일
|
업데이트된 문제 설명
|
1.0
|
2014년 8월 21일
|
초기 공개 릴리스
|
영향을 받는 제품 |
---|
UCSB-MLOM-40G-01
|
UCS-VIC-M82-8P
|
UCSB-MLOM-40G-03
|
UCSC-PCIE-C10T-02
|
UCSC-PCIE-CSC-02
|
IOM(Input/Output Module)을 업그레이드/재설정/제거/다시 삽입하거나 IOM과 FI(Fabric Interconnect) 사이의 케이블을 분리/교체할 경우, IOM을 통해 Cisco VIC(Virtual Interface Card) 1225/1227/1240/1280/1340/1380에서 이동하는 파이버 채널(FC) 스토리지 트래픽은 연결이 다시 설정된 후 문제(삭제)가 발생할 수 있습니다.
UCSM(Unified Computing System Manager)에는 이 문서에서 언급한 결함이 발생한 시각적 표시기가 없습니다.UCSM에서 가상 네트워크 인터페이스 카드/가상 호스트 버스 어댑터가 녹색으로 표시되지만 영향을 받을 경우 기본 스토리지 경로가 여전히 다운될 수 있습니다.
이그레스 FC 포트가 혼잡할 경우, 스위치는 FCoE(Fibre Channel over Ethernet) 속도를 줄이고 정의된 CoS(Class of Service) 우선 순위로 패킷 삭제를 방지하기 위해 PFC(Priority-based Flow Control) 프레임을 서버로 전송합니다.DCB(Data Center Bridging) PFC는 표준 PAUSE 프레임을 확장하여 IEEE 802.1p CoS 값을 포함합니다.PFC를 사용하면 PAUSE 프레임이 전송될 때 링크의 모든 트래픽을 중지하는 대신 PFC 프레임에서 활성화된 CoS 값에 대해서만 트래픽이 일시 중지됩니다.트래픽을 일시 중지해야 하는 활성화된 우선순위에 대해 PFC 프레임이 전송됩니다.
이 문제는 여러 가지 다른 조건에서 나타날 수 있습니다.
Cisco 버그 ID CSCuh61202에서 스위치/IOM은 Pause Register(PGS(Priority Groups) 및 PFC 업데이트)를 어댑터에 전송합니다. 특히 PFC 업데이트와 PFC 업데이트가 뒤따릅니다.VIC 펌웨어의 문제로 인해 PFC 업데이트가 발생하면 일시 중지 컨피그레이션이 올바르게 프로그래밍되지 않습니다.그러면 어댑터에서 FCoE CoS에 대한 일시 중지를 준수하지 않습니다.그러면 IOM에서 FCoE 프레임이 삭제됩니다.
Cisco 버그 ID CSCus64439는 PFC Inoperational 프레임을 수신한 후 PFC가 올바르게 재구성되지 않을 수 있는 VIC 어댑터의 이벤트 순서에 의해 트리거됩니다.그러면 어댑터에서 FCoE CoS에 대한 일시 중지를 준수하지 않습니다.그러면 IOM에서 FCoE 프레임이 삭제됩니다.
이러한 동작은 경쟁 조건이므로 일부 서버에서는 발생할 수 있지만 다른 서버에서는 발생할 수 없습니다.일반적으로 전체 섀시에서 관찰될 수 있습니다.그러나 시스템에 여러 섀시가 있는 경우에도 네트워크에 플러딩된 트래픽의 양으로 인해 올바른 Pause 컨피그레이션이 있는 섀시에 영향을 줄 수 있습니다.
Cisco 버그 ID CSCuh61202를 식별하는 단계
어댑터 syslog에서 "기능 작동"을 검색합니다.
어댑터 syslog의 영향을 받지 않는 예는 다음과 같습니다.
140416-07:30:41.096482 mcp.uif_dcbx Port 1-0: FCOE feature operational
140416-07:30:41.096588 mcp.uif_dcbx Port 1-0: MTU feature operational
140416-07:30:41.096774 mcp.uif_dcbx Port 1-0: NIV feature operational
140416-07:30:41.096910 mcp.uif_dcbx Port 1-0: PFC feature operational <--
140416-07:30:41.097054 mcp.uif_dcbx Port 1-0: PGS feature operational <--
다음은 어댑터 syslog에서 영향을 받는 예입니다.
140416-04:46:00.769934 mcp.uif_dcbx Port 1-0: NIV feature operational
140416-04:46:06.645865 mcp.uif_dcbx Port 1-0: PGS feature operational <--
140416-04:46:06.848516 mcp.uif_dcbx Port 1-0: MTU feature operational
140416-04:46:08.782584 mcp.uif_dcbx Port 1-0: FCOE feature operational
140416-04:46:10.788342 mcp.uif_dcbx Port 1-0: PFC feature operational <--
마지막 "PFC 기능 작동" 이후 어댑터 로그에 중단이 증가하는지 확인합니다.
참고:
어댑터 로그에서 메시지를 중단하는 예:
140416-08:13:12.809365 ecom.com_maincom(8:1):exch 4d56, 상태 3 rx_id b38 s_stat 0x1 xmit_recvd 0x200 burst_offset 0x200 sgl_err 0x0 last_seq_cnt 0x0 tot_bytes_exp 0x200 h_seq_cnt 0x0 exch_type 0x1 s_id 0x3d000000000 d03a0 host_tag 0x78
IOM의 HIF 포트에서 수신 버퍼가 오버런(일시 중지 프레임이 작동하지 않음을 나타내는)인지 확인합니다.
IOM show-tech-support-iom-nxos.out에서 "frames recvd without credit for pausable class"를 검색합니다.
: |3 |000001ad | wo_cr[3] | 프레임은 pavailable 클래스에 대한 크레딧이 없는 rcvd입니다.일시 중지가 없습니다.< — 0이 아닌 증가값
Cisco 버그 ID CSCus64439를 식별하는 단계
PFC 기능이 작동하지 않는 패킷과 어댑터 syslog에서 후속 PFC 및 PFC 기능 작동 패킷을 마지막으로 본 시간을 확인합니다.
150209-16:12:35.817073 mcp.uif_dcbx 포트 0-0:PFC 기능 작동
150209-17:31:11.454181 mcp.uif_dcbx 포트 0-0:PFC 기능이 작동하지 않음 <—
150209-17:31:20.512303 mcp.uif_dcbx 포트 0-0:PGS 기능 운영
150209-17:31:24.482730 mcp.uif_dcbx 포트 0-0:PFC 기능 작동
마지막 "PFC 기능 작동" 이후 어댑터 로그에 중단이 증가하는지 확인합니다.
참고:
어댑터 로그에서 메시지를 중단하는 예:
140416-08:13:12.809365 ecom.com_maincom(8:1):exch 4d56, 상태 3 rx_id b38 s_stat 0x1 xmit_recvd 0x200 burst_offset 0x200 sgl_err 0x0 last_seq_cnt 0x0 tot_bytes_exp 0x200 h_seq_cnt 0x0 exch_type 0x1 s_id 0x3d000000000 d03a0 host_tag 0x78
IOM의 HIF 포트에서 수신 버퍼가 오버런(일시 중지 프레임이 작동하지 않음을 나타내는)인지 확인합니다.
IOM show-tech-support-iom-nxos.out에서 "frames recvd without credit for pausable class"를 검색합니다.
: |3 |000001ad | wo_cr[3] | 프레임은 pavailable 클래스에 대한 크레딧이 없는 rcvd입니다.일시 중지가 없습니다.< — 0이 아닌 증가값
CLI에서 로그 정보 수집
섀시 2, 서버 3, 어댑터 1과 연결된 어댑터 로그를 찾으려면 라이브 시스템의 CLI에서 구문을 확인하십시오.
ucs-B# connect adapter 2/3/1
adapter 2/3/1 # connect
No entry for terminal type "dumb";
using dumb terminal settings.
adapter 2/3/1 (top):1# show-log
참고:또는 grep는 불가능합니다. |이 셸에 포함하십시오.
UCSM에서 로그 정보 수집
의심되는 섀시에 대한 섀시 기술 지원을 수집합니다.
Cisco CIMC(Integrated Management Controller) 기술 지원 파일의 압축을 풀고 영향받는 어댑터의 MEZZ 기술 지원 폴더로 이동합니다.이 예에서는 서버 3에 대한 어댑터 로그가 표시됩니다.MEZZ31_TechSupport.tar.gz 파일의 tar를 해제합니다.
MEZZ 기술 지원 폴더를 확장하고 obfl.tar.gz 파일의 tar를 해제합니다.
obfl 폴더로 이동하고 텍스트 편집기를 사용하여 syslog/syslog.1 파일을 엽니다.
상황에 따라 고객은 임시/즉시 해결 방법 또는 선호하는 해결 방법을 선택할 수 있습니다.
즉시 해결 방법:IOM으로 트래픽을 플러딩하는 블레이드를 재부팅합니다.그러면 일시 중지 구성이 다시 프로그래밍됩니다.
기본 해결 방법:이 방법은 이 문제를 장기적으로 피하기 위한 것입니다.업그레이드를 수행해야 하는 경우인프라 구성 요소(A-bundle) 이전에 어댑터(B/C-bundle) 펌웨어가 업그레이드되도록 업그레이드를 계획합니다. 시스템의 모든 구성 요소를 동일한 유지 관리 창에서 블레이드에서 FI로 업그레이드하여 시스템이 서로 다른 버전에 배치되지 않도록 하는 것이 좋습니다.
2.2x에서 3.1x 릴리스로 업그레이드하려는 경우 먼저 B/C-번들을 2.2(6g)로 업그레이드한 다음 2.2(6g) A-bundle로 업그레이드하십시오.이후 일반 순서로 3.1x로 업그레이드할 수 있습니다.
2.1x에서 2.2x/3.1x 릴리스로 업그레이드하려는 경우 먼저 B/C 번들을 2.1(3k)으로 업그레이드한 다음 2.1(3k) A 번들로 업그레이드하십시오.그런 다음 정상 순서로 2.2.x/3.1x로 업그레이드할 수 있습니다.
이 알림에 언급된 모든 결함 수정 사항을 포함하는 릴리스 3.1(1e) 또는 2.2(6g) 및 그 후속 릴리스는 Cisco Software Download Release 2.2 이상에서 찾을 수 있습니다.
릴리스 2.1에서 릴리스 2.2로 Cisco UCS 업그레이드를 참조하십시오.
이 문제를 방지하려면 UCS 인프라 구성 요소(UCSM/IOM/FI)를 업데이트하기 전에 Cisco 1225/1227/1240/1280/1340/1380 어댑터 펌웨어를 업그레이드해야 합니다. 이 절차는 Cisco의 UCS 업그레이드 가이드에 따라 진행되지만, 이 문제를 방지하려면 권장됩니다.
아래 버그 ID 링크를 따라 자세한 버그 정보를 보려면 등록된 고객이어야 하며 로그인해야 합니다.
CDETS | 설명 |
---|---|
CSCuh61202(등록된 고객만 해당) | VIC:IOM 재설정/재장착/케이블 당기기 또는 업그레이드 후 FC 트래픽 감소 |
CSCus64439(등록된 고객만 해당) | "PFC 기능 작동"이 업데이트되지 않으면 스토리지 레이턴시 및 중단이 발생합니다. |
추가 지원이 필요하거나 이 필드 알림에 대한 추가 질문이 있는 경우 다음 방법 중 하나를 사용하여 Cisco Systems Technical Assistance Center(TAC)에 문의하십시오.
Cisco Notification Service - 지정한 Cisco 제품에 대한 신뢰성, 안전, 네트워크 보안 및 판매 중단 문제에 대한 이메일 업데이트를 수신하기 위한 프로필을 설정합니다.