本產品的文件集力求使用無偏見用語。針對本文件集的目的,無偏見係定義為未根據年齡、身心障礙、性別、種族身分、民族身分、性別傾向、社會經濟地位及交織性表示歧視的用語。由於本產品軟體使用者介面中硬式編碼的語言、根據 RFP 文件使用的語言,或引用第三方產品的語言,因此本文件中可能會出現例外狀況。深入瞭解思科如何使用包容性用語。
思科已使用電腦和人工技術翻譯本文件,讓全世界的使用者能夠以自己的語言理解支援內容。請注意,即使是最佳機器翻譯,也不如專業譯者翻譯的內容準確。Cisco Systems, Inc. 對這些翻譯的準確度概不負責,並建議一律查看原始英文文件(提供連結)。
本文檔介紹如何針對與堆疊埠/電纜問題和靜默重新載入具體相關的問題對命令/註冊進行故障排除。
收集和分析有用的暫存器(針對每個ASIC和核心)。主要有三個方面:
show platform hardware fed switch active fwd-asic register read register-name <name>
第一位告訴我們asic是否可用。設定為0x1。如果設定為0x0,則存在轉發問題。錯誤計數器或方塊無法正確復原封包。
Switch#sh platform hardware fed switch active fwd-asic register read register-name SifInfo For asic 0 core 0 Module 0 - SifInfo[0][0] available : 0x1 <---- should be 0x1 indicating balloting is completed headerVersion : 0x0 nodeAllLinksAvailable : 0x1 nodeId : 0x4 <---- asic ID (unique across all asics in the stack) numNodes : 0x8 <---- how many asics are there in whole stack serdesSpeed : 0x2 sifAllLinksAvailable : 0x1 sifSupStall : 0x0 wrappedAtRac0 : 0x0 <---- If a single stack port is down, 3 of 6 should wrap w/ value wrappedAtRac1 : 0x0 of 0x1. Will appears in groups for 0, 2 and 4 or 1, 3 and 5. wrappedAtRac2 : 0x0 wrappedAtRac3 : 0x0 wrappedAtRac4 : 0x0 wrappedAtRac5 : 0x0
注意:每條堆疊電纜有六個rac環(環訪問控制),每條有3個傳出/3個傳入,均為40Gig。WrappedAtRac 0到5對應任一堆疊連結是否關閉。如果情況良好,則顯示為0x0(每個asic六個鏈路,三個傳出,三個傳入。例如,奇數是傳出的,偶數是傳入的,反之亦然)。
若要詳細檢查每個Rac,會顯示要驗證的「重要」方面;active/linkOk/syncOk位元會告知我們特定Rac是否已連結(如果「確定」,則會顯示為0x1)。
Switch#sh plat hardware fed sw active fwd-asic register read register-name SifRacStatus For asic 0 core 0 Module 0 - SifRacStatus[0][0] active : 0x1 <---- available : 0x1 copyOk : 0x1 disabled : 0x0 insertOk : 0x1 linkOk : 0x1 <---- messageOk : 0x1 noDataOnRing : 0x0 pcsAlignmentOk : 0x1 pcsCodewordSync : 0xf reOrderOk : 0x1 slapId : 0x0 stripOk : 0x1 syncOk : 0x1 <---- toPbcOk : 0x1 transmitOk : 0x1
檢視Rac是否斷電。檢查greenPowerDisable引數。這顯示所有Racs的0x0(至少對於Nyquist平台)。由於堆疊電纜本身的硬體限制,某些例外情況(例如下端盒的3650交換機)可能會導致Racs斷電或greenPowerDisable引數顯示為0x1。因此,堆疊電纜僅支援每個asic兩個Racs。其餘兩個Racs已關閉。
Switch#sh plat hardware fed sw active fwd-asic register read register-name SifRacControl For asic 0 core 0 Module 0 - SifRacControl[0][0] copyEn : 0x1 deployToken : 0x0 disablePmaChecks : 0x0 forceSync : 0x0 greenPowerDisable : 0x0 <---- init : 0x0 initRacInfoLinkedList : 0x0 insertEn : 0x1 messageEn : 0x1 reOrderEn : 0x1 stripEn : 0x1 toPbcEn : 0x1 transmitEn : 0x1
觸發此錯誤是因為系統中有連結變更(啟動/關閉狀況)。在軟體級別處理中斷。系統會對其進行處理,以檢視是否有任何與連結相關的更改,然後發佈它(生成日誌)。
Switch#sh plat hardware fed sw active fwd-asic register read register-name SifExceptionInterruptA4 For asic 0 core 0 Module 0 - SifExceptionInterruptA4[0][0] sifRac0LinkOkChange : 0x0 sifRac0LinkedListSpill : 0x0 sifRac0SyncOkChange : 0x1 sifRac0TransitFifoSpill : 0x0 sifRac1LinkOkChange : 0x0 sifRac1LinkedListSpill : 0x0 sifRac1SyncOkChange : 0x1 sifRac1TransitFifoSpill : 0x0 sifRac2LinkOkChange : 0x0 sifRac2LinkedListSpill : 0x0 sifRac2SyncOkChange : 0x1 sifRac2TransitFifoSpill : 0x0 sifRac3LinkOkChange : 0x0 sifRac3LinkedListSpill : 0x0 sifRac3SyncOkChange : 0x1 sifRac3TransitFifoSpill : 0x0 sifRac4LinkOkChange : 0x0 sifRac4LinkedListSpill : 0x0 sifRac4SyncOkChange : 0x1 sifRac4TransitFifoSpill : 0x0 sifRac5LinkOkChange : 0x0 sifRac5LinkedListSpill : 0x0 sifRac5SyncOkChange : 0x1 sifRac5TransitFifoSpill : 0x0
這是硬體中斷,會在投票完成時提供詳細資訊(投票= asic初始化程式)。在A8完成後,系統檢查是否正確設定了asic可用位。如果不是,則再次執行投票。
注意:達到最大數量時,交換機重新載入時出現一些錯誤,說明未設定HW可用位或投票未完成。
Switch#sh plat hardware fed sw active fwd-asic register read register-name SifExceptionInterruptA8 For asic 0 core 0 Module 0 - SifExceptionInterruptA8[0][0] sifBallotDone : 0x0 sifBallotOverallTimerExpires : 0x0 sifBallotPerStateTimerExpires : 0x0 sifBallotSpeedChangeNeeded : 0x0 sifBallotStart : 0x1 sifDebugSent : 0x0 sifEastNeighborChange : 0x1 sifMessageReceiveBufferCreditsEmpty : 0x0 sifMessageReceived : 0x1 sifMessageSent : 0x1 sifNodeIdChanged : 0x1 sifOob3in2DropCntOverflow : 0x0 sifOobFlushDropCntOverflow : 0x0 sifOobStackSifCreditDropCntOverflow : 0x0 sifOobStackSifMtuDropCntOverflow : 0x0 sifOobSupSifMtuDropCntOverflow : 0x0 sifRacInfoLinkedListInitDone0 : 0x1 sifRacInfoLinkedListInitDone1 : 0x1 sifRacInfoLinkedListInitDone2 : 0x1 sifRacInfoLinkedListInitDone3 : 0x1 sifRacInfoLinkedListInitDone4 : 0x1 sifRacInfoLinkedListInitDone5 : 0x1 sifSegmentBuffer0LinkedListSpill : 0x0 sifSegmentBuffer1LinkedListSpill : 0x0 sifSegmentBufferLinkedListInitDone0 : 0x1 sifSegmentBufferLinkedListInitDone1 : 0x1 sifStackTopologyChange : 0x1 sifUnmappedDestIndex : 0x0 sifWestNeighborChange : 0x1
下一個命令顯示涉及SDP消息和SIF管理消息的SIF計數器。關註失敗的消息(如果有)。
Switch#show platform software sif switch active r0 counters Stack Interface (SIF) Counters ------------------------------ Stack Discovery Protocol (SDP) Messages --------------------------------------- Message Tx Success Tx Fail Rx Success Rx Fail ------------------------------------------------------------------------------ Discovery 0 0 0 0 Neighbor 0 0 0 0 Forward 455966 0 1355818 107 --------------------------------------- SIF Management Messages ----------------------- Message Success Fail -------------------------------------------------- Link Status 16 0 Link Management 0 0 Chassis Num 1 0 Topo Change 3 0 Active Declare 1 0 Template set 2 0
有一個附加命令可以運行,只有當中斷超過閾值時才能顯示資訊。命令為show platform software sif switch active R0 exceptions。 以下是當中斷上沒有問題時的輸出:
Switch#
Switch#show platform software sif switch active R0 exceptions
Switch#
如果存在中斷,則輸出類似於下一個指令碼。請記住,在某些場景中會出現中斷(啟動、插入/取消插入等),因此如果確實存在問題且中斷持續不斷,請重複執行命令一段時間(秒/分鐘)。
Switch#show platform software sif switch active r0 exceptions
*******************************
Asicnum: 0
SIF INT : SIFEXCEPTIONINTERRUPTA1_SIFRAC5PMARECEIVEFIFOSPILL3_FIELD_IDX
Occurred count: 1
First Time: Fri May 18 08:03:23 2018
Last Time: Fri May 18 08:03:23 2018
---------------------------------
SIF INT : SIFEXCEPTIONINTERRUPTA1_SIFRAC5PMARECEIVEFIFOSPILL2_FIELD_IDX
Occurred count: 1
First Time: Fri May 18 08:03:23 2018
Last Time: Fri May 18 08:03:23 2018
---------------------------------
SIF INT : SIFEXCEPTIONINTERRUPTA1_SIFRAC5PMARECEIVEFIFOSPILL1_FIELD_IDX
Occurred count: 1
First Time: Fri May 18 08:03:23 2018
Last Time: Fri May 18 08:03:23 2018
---------------------------------
SIF INT : SIFEXCEPTIONINTERRUPTA1_SIFRAC5PMARECEIVEFIFOSPILL0_FIELD_IDX
Occurred count: 1
First Time: Fri May 18 08:03:23 2018
Last Time: Fri May 18 08:03:23 2018
下表詳細列出了來自
show platform software sif switch active R0 exceptions的最常見SIF異常:
例外狀況# | 欄位名稱 | 嚴重性 | 使用量 | 說明 |
0 | sifRac{0:5}PmaTransmitFifoSpill{0:3} | 主要 | 統計資料 | 如果系統時鐘和串列時鐘之間的推拉FIFO溢位,則會觸發此情況。這不可能發生。如果是,則可能表示已停用塞爾代時鐘(透過程式設計或錯誤的塞爾代)。 如果這不是程式設計問題的原因,則是一個主要問題。但SIF可以自我治癒。小問題的最終結果是資料段丟失,或者在極端情況下重新初始化。如果這不是一個小問題,並且它仍在發生,那麼在處理完此CHIEF後,它會重新激發,告訴您此時此情況仍在發生。此傳輸鏈路為toast。 |
1 | sifRac{0:5}PmaReceiveFifoSpill{0:3} | 主要 | 統計資料 | 如果系統時鐘和串列時鐘之間的推拉FIFO溢位,則會觸發此情況。這不可能發生。如果是,則可能表示已停用塞爾代時鐘(透過程式設計或錯誤的塞爾代)。 如果這不是程式設計問題的原因,則是一個主要問題。但SIF可以自我治癒。小問題的最終結果是資料段丟失,或者在極端情況下重新初始化。如果這不是一個小問題,並且它仍在發生,那麼在處理完此CHIEF後,它會重新激發,告訴您此時此情況仍在發生。此傳輸鏈路為toast。 |
2 | sifRac{0:5}SerdesLossOfLock{0:3} | 主要 | 統計資料 | 用於與sifRac{0:5}PmaReceiveFifoSpill{0:3}關聯,以通知所接收的Serdes時鐘的狀況(w.r.t.正常運行狀況)。如果它們不符合規格,則IdleDensity計時器無法補償此差異。一般而言,這是一個問題檢查器,以確保接收方Serdes工作正常的假設是真實的。 |
3 | sifRac{0:5}ClockLossOfLock{0:3} | 主要 | 統計資料 | 用於與sifRac{0:5}PmaReceiveFifoSpill{0:3}關聯,以通知所接收的Serdes時鐘的狀況(w.r.t.正常運行狀況)。如果它們不符合規格,則IdleDensity計時器無法補償此差異。一般而言,這是一個問題檢查器,以確保接收方Serdes工作正常的假設是真實的。 |
4 | sifRac{0:5}syncOkChange | 輕微 | 監視 | 鏈路抖動的指示 |
sifRac{0:5}linkOkChange | 輕微 | 監視 | 鏈路抖動的指示 | |
sifRac{0:5}linkedListSpill | 主要 | 監視 | 作為重新排序演演算法一部分的Rac連結清單已超過可能的最大專案數。這非常糟糕,表示重新排序作業現在會在此RAC上拖尾資料區段和OOB訊息。除非堆疊配置錯誤或連結清單發生軟錯誤,否則不會發生這種情況。請參閱例外9與10。 | |
sifRac{0:5}傳輸先進先出 | 主要 | 統計資料 | 負責透過SIF將資料移動到其他節點的transitFifo已經溢位,這可能是由於IdleDensityTimer w.r.t.配置錯誤導致此交換機與其鄰居的實際Serdes時鐘ppm (單位:百萬分)偏移量造成的。 | |
5 | sifRac{0:5}missingToken | 主要 | 統計資料 | 堆疊螺殼已遺失、損毀、重新分解等等。這可能表示堆疊上發生位元命中的專案命中SifTokenDesc。這是一件極不可能發生的事情。可以將SIF配置為以不同方式處理此問題。重新投票並重新開始、重新部署令牌或允許SIF重新部署。 |
sifRac{0:5}duplicateToken | 主要 | 統計資料 | ||
sifRac{0:5}令牌已部署 | 資訊 | 統計資料 | ||
6 | sifRac{0:5}RwCrcErrorCntOverflow | 輕微 | 統計資料 | 堆疊電纜或鄰居盒的所有指示器可能已損壞。主要是為了調試而展開此細節。在正常操作過程中,您只需要知道syncOkChange和linkOkChange。在收集LONG-TERM-BER時,計數器翻過來時,您需要監控並計算這些值,以便正確計算位錯誤。當存在invalidRw或pcsCodeWordError時,可能表示未檢查CRC。這樣您就可以將所有的暫存器加起來進行BER運算。 |
sifRac{0:5}DataCrcErrorCntOverflow | 輕微 | 統計資料 | ||
sifRac{0:5}InvalidRwErrorCntOverflow | 輕微 | 統計資料 | ||
sifRac{0:5}PcsCodeWordErrorCntOverflow | 輕微 | 統計資料 | ||
7 | sifRac{0:5}RdispErrorCntOverflow | 輕微 | 統計資料 | |
sifRac{0:5}PrbsUnLockErrorCntOverflow | 資訊 | 統計資料 | 顯示用於幫助查詢IBM HSS宏的最佳配置的統計資訊,以查詢最佳程式設計。 | |
sifRac{0:5}PrbsBitErrorCntOverflow | 資訊 | 統計資料 | ||
sifRac{0:5}ErrorCaptureCntOverflow | 資訊 | 實驗室 | 顯示用於捕獲erroringWords形式的統計資訊,以供檢查以檢視堆疊上發生的情況。 | |
8 | sifRacInfoLinkedListInitDone{0:5} | 資訊 | 監視 | RAC連結清單的硬體初始化已完成。 |
sifDroppedSegmentCntOverflow | 資訊 | 統計資料 | ||
sifPbcInconsistentSopEopCntOverflow | 資訊 | 統計資料 | 最壞的情況。根據PBC的協定表單檢查資料是否到達。 | |
sifPbcErrorCntOverflow | 資訊 | 統計資料 | ||
sifSupInconsistentSopEopCntOverflow | 資訊 | 統計資料 | 最壞的情況。根據SUP (OOBM)提供的協定表單檢查資料是否到達。 | |
sifSupErrorCntOverflow | 資訊 | 統計資料 | ||
sifReorderInconsistentSopEopCntOverflow | 資訊 | 統計資料 | 表示遺失的區段指示器已捲動。 | |
sifDebugSent | 資訊 | 實驗室 | 顯示將調試段插入堆疊的指示。 | |
sifMessageSent | 資訊 | 實驗室 | 由於OOBM的自動化性質,這些功能僅在實驗室環境中才真正有用。 | |
sifMessageReceived | 資訊 | 實驗室 | ||
sifMessageDropped | 資訊 | 實驗室 | ||
sifMessageReceiveBufferCreditsEmpty | 輕微 | 監視 | 如果觸發此動作,請重新整理積分。信用等級會受到主動監控,因此不會發生錯誤。 | |
sifUnmappedDestIndex | 輕微 | 統計資料 | 在Copy/Strip過程中,它無法對映destIndex,並且portCopy設定為「0」,portStrip設定為「1」。這表示存在配置問題。 | |
sifSegmentBuffer{0:1}linkedListSpill | 主要 | 監視 | 屬於重新排序一部分的區段連結清單已超過可能的最大專案數。這表示重新排序現在是尾部丟棄資料段和OOB消息。除非堆疊配置錯誤或連結清單發生軟錯誤,否則不會發生這種情況。請參閱例外9與10。 | |
sifSegmentBufferLinkedListInitDone{0:1] | 資訊 | 監視 | 段連結清單的HW初始化已完成。 | |
sifVoiceDone | 資訊 | 監視 | 指示投票已完成。 | |
需要SifVoiceSpeedChange | 資訊 | 監視 | 自上次成功投票以來,堆疊鏈路上需要新的速度。這表示節點已進入堆疊,且堆疊速度的動態有所變更。堆疊可能比目前的速度慢,因此必須向下調整。或者比以前更快。這可能是新的較短電纜的結果。 | |
sifEastNeighborChange | 資訊 | 監視 | 監控堆疊的啟動、合併和包裝情況。 | |
sifWestNeighborChange | 資訊 | 監視 | ||
sifNodeId已更改 | 資訊 | 監視 | 表示作為上次投票的結果,SifInfo.nodeId已更改。 | |
sifStackTopologyChange | 資訊 | 監視 | 監控堆疊的啟動、合併和包裝情況。 | |
9 | sifRacInfoBuffer{0:5}已更正 | 主要 | 監視 | sifRacInfoBuffer{0:5}發生軟錯誤。這是很糟糕的,但最糟糕的結果是輸出資料路徑中存在一些無序資料包或稍後丟棄的資料包。此處不需要重設都卜勒。 |
sifRacInfoBuffer{0:5}EccDetected | 主要 | 監視 | ||
sifRacInfoLinkedListBuffer{0:5}EccCorrected | 主要 | 監視 | sifRacInfoLinkedListBuffer{0:5}發生軟錯誤。根據此SW負載的拱形HA指南,您需要重置都卜勒。這可能會導致SifReorder出現效能問題。 | |
sifRacInfoLinkedListBuffer{0:5}EccDetected | 主要 | 監視 | ||
sifSegmentLinkedListBuffer{0:1}EccCorrected | 主要 | 監視 | sifRacInfoLinkedListBuffer{0:5}發生軟錯誤。根據此SW負載的拱形HA指南,您需要重置都卜勒。這可能會導致SifReorder出現效能問題。 | |
sifSegmentLinkedListBuffer{0:1}EccDetected | 主要 | 監視 | ||
10 | DestinationIndexTableParityError | 主要 | 監視 | 記憶體被奇偶校驗錯誤擊中。重新載入內容,並辨識某些資料包可能因此被錯誤複製/刪除。可能不需要重設都卜勒。 |
全域至本機連線埠表格 | 主要 | 監視 | ||
CpuIndexTable | 主要 | 監視 | ||
HashTableA | 主要 | 監視 | ||
HashTableB | 主要 | 監視 | ||
MessageQueueFifo | 主要 | 監視 | 訊息控制記憶遭到軟錯誤攻擊。這是一個臨時問題,可能導致錯誤轉發或無序的OOB。這可以自我修復,不需要都卜勒重置,因為此處條目的新使用者可以覆蓋舊條目。 | |
MessageQueueLinkBuffer | 主要 | 監視 |
可以在EDCS-757121:NG3K SIF驅動程式軟體功能規範中找到此資訊。
其他堆疊暫存器
- SifRacStatus
- Sif統計資料
- SifRacInsertedCnt
- SifRacCopiedCnt
- SifRacPmaControl
- SifVoiceWatchDogTimer
- SifPbcSifErrorCnt
- SifMessageStatus
- SifControl
- SupStackInterfaceControl
- SifSifPbcCnt0
- SifSifPbcCnt1
- SifSifPbcDroppedCnt
- SifSerdesHssMacroStatus
- SifSerdesHssChannelStatusRx
- SifSerdesHssChannelStatusTx
瞭解每個暫存器的詳細資訊。
用於監控堆疊連線埠健康狀況的CLI:
show platform hardware fed switch <> fwd-asic register read register-name SifSerdesHssMacroStatus
show platform hardware fed switch <> fwd-asic register read register-name SifInfo
show platform hardware fed switch <> fwd-asic register read register-name SifRacStatus
show platform hardware fed switch <> fwd-asic register read register-name SifRacControl
show platform hardware fed switch <> fwd-asic register read register-name SifExceptionInterruptA8
show platform hardware fed switch <> fwd-asic register read register-name SifExceptionInterruptA4
show platform hardware fed switch <> fwd-asic register read register-name SifStatistics
show platform hardware fed switch <> fwd-asic register read register-name SifRacInsertedCnt
show platform hardware fed switch <> fwd-asic register read register-name SifRacCopiedCnt
show platform hardware fed switch <> fwd-asic register read register-name SifRacPmaControl
show platform hardware fed switch <> fwd-asic register read register-name SifVoiceWatchDogTimer
show platform hardware fed switch <> fwd-asic register read register-name SifPbcSifErrorCnt
show platform hardware fed switch <> fwd-asic register read register-name SifMessageStatus
show platform hardware fed switch <> fwd-asic register read register-name SifControl
show platform hardware fed switch <> fwd-asic register read register-name SupStackInterfaceControl
show platform hardware fed switch <> fwd-asic register read register-name SifSifPbcCnt0
show platform hardware fed switch <> fwd-asic register read register-name SifSifPbcCnt<>
show platform hardware fed switch <> fwd-asic register read register-name SifSifPbcDroppedCnt
show platform hardware fed switch <> fwd-asic register read register-name SifSerdesHssChannelStatusRx
show platform hardware fed switch <> fwd-asic register read register-name SifSerdesHssChannelStatusTx
show platform hardware fed switch <> fwd-asic register read register-name SifRacDataCrcErrorCnt
show platform hardware fed switch <> fwd-asic register read register-name SifgRacRwCrcErrorCnt
show platform software sif switch <> R0計數器
show platform software sif switch <> R0異常
從Linux核心讀取暫存器
.
進入Linux Shell後,繼續執行下一個指令碼:
[Switch_2_RP_0:~]$ dope.sh Num Asics: 0 Cat9300 platform dope vft **************************************************** DOPpler Examiner http://wwwin-dopplersdk.cisco.com **************************************************** Detecting number of asics...found 1 asics asic-0: phy_addr=0x87f80000000 virt_addr=0x7f84d746f000 Loading Library : libasd2_DL.so ... Success. (null) ASIC Layer libraries successfully loaded!!! ASIC version: 0x448 Starting ASIC Driver create Driver and Device Init Completed. dope[0,0]> rdsp SifControl <------- rdsp <register name>
在Dope.sh中變更ASIC
上一個程式檔正在讀取引數1,asic zero。請在執行此指令碼時更改以下內容:
dope[0,0]> asic 1 <--- changes to asic 1
dope[1,0]>
注意: Dopto.sh (Doppler shell)是硬體程式設計中的最低級別。這是直接從硬體讀取環值的方式。在rdsp命令之後,使用先前指令碼中的其他堆疊暫存器以獲得最精細的資料(如果需要)。
無訊息重新載入問題
每當進行靜默重新載入(未生成crashdump/system_report)時,就會顯示崩潰跟蹤日誌,這些日誌顯示一些特定檔案,以獲取有關導致事件的原因的更多資訊。
步驟 1
我們可以首先檢視stack_mgr_R0,然後從它的角度檢視重新載入的原因。例如:
步驟 2
我們現在可以轉到pvp日誌。使用從stack_mgr_R0提取的時間戳(具體發生在重新載入時),並檢視pvp_F0 和pvp_R0,以確定在執行所有重新載入協調流程順序之前,進程何時開始終止順序。例如:
注意:它可以顯示pvp_F0和pvp_R0。
注意:請務必檢查這兩者,因為您可能會看到linux_iosd_image進程在pvp_R0中終止,但pvp_F0中的另一個進程之前已終止。這是一個關鍵因素,因為第一個過程被扼殺。然後,它可以指出問題的觸發因素。
步驟 3
在pvp_F0和pvp_R0中,還有在進程停止/保持之後提供的退出代碼。對於實際進程崩潰,使用退出代碼129等。pvp就是這樣得知需要建立crashdump/system_report的。如果沒有crashdump/system_report,則退出代碼通常為零。例如:
步驟 4
辨識罪魁禍首程式之後,請移至與程式相關的追蹤記錄檔,並檢查詳細資訊。
堆疊成員逾時/重新載入-個案研究
兩台交換器之間的單一錯誤纜線可能會由於遺失keepalive而造成堆疊中的任何交換器重新載入。
症狀
發生問題的堆疊追蹤或交換器會產生以下錯誤:
- 9300-1# show platform software trace message stack-mgr switch active R0 | inc未響應
- 2018 <tel:2018>/05/10 13:57:30.397 [stack_mgr] [24459]: UUID: 0, ra: 0, TID: 0 (註):對等體4無響應,適用於8000 <tel:8000>毫秒。Bookkeep=3EFDD last_msg = 3EFD5
- 2018 <tel:2018>/05/10 13:57:29.396 [stack_mgr] [24459]: UUID: 0, ra: 0, TID: 0 (註):對等體6無響應,適用於8000 <tel:8000>毫秒。Bookkeep=3EFDC last_msg = 3EFD4
簿記會每秒檢查一次堆疊中每台交換機上次發出的資訊(從運行簿記的交換機的角度而言)。在8000毫秒的no keepalive之後,我們開始列印對等體未被偵聽的跟蹤。在16000毫秒處,有問題的交換器會重新載入以尋找遺失的keepalive。
9300-1#sh switch stack-ports sum Load for five secs: 8%/4%; one minute: 9%; five minutes: 9% Time source is NTP, 11:53:11.196 EDT Thu May 17 2018 Sw#/Port# Port Status Neighbor Cable Length Link OK Link Active Sync OK #Changes to LinkOK In Loopback ------------------------------------------------------------------------------------------------------------------- 1/1 OK 2 100cm Yes Yes Yes 2 No 1/2 OK 8 300cm Yes Yes Yes 143 No <----------- 2/1 OK 3 50cm Yes Yes Yes 1 No 2/2 OK 1 100cm Yes Yes Yes 1 No 3/1 OK 4 50cm Yes Yes Yes 1 No 3/2 OK 2 50cm Yes Yes Yes 1 No 4/1 OK 5 50cm Yes Yes Yes 1 No 4/2 OK 3 50cm Yes Yes Yes 1 No 5/1 OK 6 50cm Yes Yes Yes 1 No 5/2 OK 4 50cm Yes Yes Yes 1 No 6/1 OK 7 50cm Yes Yes Yes 1 No 6/2 OK 5 50cm Yes Yes Yes 1 No 7/1 OK 8 50cm Yes Yes Yes 1 No 7/2 OK 6 50cm Yes Yes Yes 1 No 8/1 DOWN NONE 300cm No No Yes 116 No <---------------- 8/2 OK 7 50cm Yes Yes Yes 1 No
在連線交換器之間的堆疊連結中有大量不穩定情況時,也會發生此逾時,最終導致一台交換器認為堆疊連線埠已開啟且能夠傳遞流量,但另一台認為堆疊連線埠已關閉。
堆疊環在順時針和逆時針方向操作。環上的流量可以採用任一條路徑,而不考慮其目的地址。這表示如果交換器2要傳送keepalive到交換器1,它可以經過交換器3、4、5、6、7、8再經過1,或直接從2到1。從交換機1到交換機2的發往交換機8的雜湊返回流量會被丟棄,導致前面指令碼中顯示的超時。
縮寫說明
- OOB:頻外
- SIF:堆疊介面
- RAC:環存取控制器
修訂 | 發佈日期 | 意見 |
---|---|---|
1.0 |
27-Jun-2024 |
初始版本 |