簡介
本文檔介紹對MDS 9000平台執行自動運行狀況和配置檢查的過程和要求。
必要條件
需求
只有運行受支援的NX-OS®軟體版本的MDS平台才支援自動運行狀況和配置檢查。
支援以下硬體平台:
- 所有尚未達到最後支援日期的MDS 9000系列交換機:硬體請參閱此處的MDS生命週期終止和銷售終止通知:
生命週期終止和銷售終止通知
附註:硬體必須屬於有效的思科合約,並且提交運行狀況和配置檢查的CCOID必須與同一合約關聯。
採用元件
本文件所述內容不限於特定軟體和硬體版本。
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路運作中,請確保您瞭解任何指令可能造成的影響。
慣例
如需文件慣例的詳細資訊,請參閱思科技術提示慣例。
運行狀況和配置檢查過程
要對MDS交換機執行自動運行狀況和配置檢查,請在思科支援案例管理器開啟常規TAC服務請求,並使用以下一組關鍵字:
技術:資料中心和儲存網路
子技術:MDS9000 — 運行狀況和配置檢查(自動)
問題代碼:運行狀況和配置檢查
對於已開啟的TAC SR,上傳從交換器擷取的show tech-support details指令輸出,格式為.txt或.gz/.tar。 目前,支援以ASCII和UTF-8文本格式捕獲的show tech-support details檔案。有關上傳說明,請參閱TAC客戶檔案上傳。
從NX-OS 8.4(2d)和9.2(1)開始,MDS tac-pac 命令已得到增強,可在bootflash上快速建立包含顯示技術支援詳細資訊和附加show logging的文檔。這是為需要顯示技術支援詳細資訊(包括自動運行狀況和配置檢查案例)的任何TAC服務請求(SR)建立輸入檔案的首選方法。
將所需的輸出附加到SR後,Cisco automation將分析日誌,並提供附加到傳送給您的電子郵件的報告(PDF格式)。該報告包含檢測到的問題的清單、排除問題的相關步驟以及建議的行動計畫。
如果對報告的運行狀況檢查失敗情況存在疑問,建議您開啟包含適當關鍵字的單獨服務請求以獲取進一步幫助。強烈建議參閱為自動運行狀況和配置檢查開啟的服務請求(SR)編號以及生成的報告,以加快調查速度。
嚴重性級別
表中是下一個標準NX-OS嚴重性級別,並且使用它們的定義。
嚴重性級別 |
說明 |
Emergency(0) |
系統不可用。 |
警報(1) |
緊急狀況需要立即關注 |
嚴重(2) |
主要情況。 |
錯誤(3) |
次要情況。 |
警告(4) |
警告條件。 |
通知(5) |
基本通知和參考消息。可能 無關緊要。 |
資訊(6) |
正常事件,表示返回正常狀態。 |
運行狀況和配置檢查模組
自動MDS運行狀況和配置檢查版本1(2023年5月發佈)會執行表1中列出的檢查。
表 1:運行狀況檢查模組和模組使用的關聯CLI
索引 |
運行狀況檢查模組 |
模組的簡短說明 |
用於執行運行狀況檢查的CLI |
1 |
NX-OS版本檢查 |
檢查裝置是否運行Cisco推薦的NX-OS軟體版本。 |
顯示版本 |
2 |
MDS收發器檢查EOL/EOS |
檢查是否有任何收發器是壽命終止(EOL)或銷售終止(EOS)。 |
顯示版本 show clock show hardware |
3 |
MDS交換機上FC介面的資料速率使用情況 |
檢查介面輸入和輸出速率。列出利用率高於80%的介面上的前10個介面和警報。 |
顯示版本 show interface brief 顯示介面 |
4 |
MDS交換機的收發器詳細資訊 |
檢查介面溫度、電壓、電流、發射功率或rx功率值以查詢標稱值。如果檢測到故障,則建議後續步驟。 |
顯示版本 show hardware 顯示介面收發器詳細資訊 |
5 |
基於運行NX-OS版本檢查PSIRT缺陷 |
根據硬體/軟體和配置與多種PSIRT匹配。這並非詳盡無遺。 |
顯示版本 show running-config |
6 |
MDS檢查時鐘資訊 |
檢查推薦的時鐘配置,並提供推薦的時鐘配置示例。 |
show running-config show clock |
7 |
MDS硬體檢查EOL/EOS |
確定MDS模組和機箱的壽命終止(EOL)和支援終止(EOS)日期。 |
顯示版本 show module show hardware 顯示庫存 |
8 |
MDS軟體檢查EOL/EOS |
確定MDS NX-OS版本的生命週期終止(EOL)和支援終止(EOS)日期。 |
顯示版本 show module |
9 |
MDS FCNS資料庫和FLOGI資料庫一致性檢查 |
檢查show FCNS資料庫和show FLOGI資料庫輸出之間是否一致。 |
顯示版本 show hardware show flogi database show fcns database local vsan 1-4093 |
10 |
MDS檢查所有TF埠上的所有VSAN是否啟動且處於活動狀態 |
檢查以確保所有TF埠都允許的VSAN處於活動狀態,沒有處於隔離或初始化狀態的VSAN。 |
顯示版本 show hardware 顯示介面 show interface brief show port-channel database |
11 |
MDS檢查所有VSAN在所有TE埠上是否啟動且處於活動狀態 |
檢查以確保所有TE埠都允許的VSAN處於活動狀態,沒有處於隔離或初始化狀態的VSAN。 |
顯示版本 show module 顯示介面 show interface brief show port-channel database |
12 |
MDS OUI檢查遠端裝置 |
檢查以確保MDS識別通過中繼和埠通道連線連線的OUI。 |
show flogi internal event-history error show port internal event — 歷史錯誤 show system internal fcfwd idxmap interface show flogi internal event-history debugs 顯示記帳日誌 |
13 |
MDS CFS鎖定檢查 |
檢查CFS鎖和清除鎖的建議步驟。 |
顯示版本 show module show hardware show cfs lock show logging log show cfs internal session-history show cfs peers show fcdomain domain domain-list show cfs internal event-history error show clock |
14 |
MDS檢查活動管理引擎mgmt0鏈路 |
檢查是顯示活動還是僅顯示supervisor mgmt0鏈路狀態。 |
顯示版本 show interface mgmt0 |
15 |
MDS 9700檢查備用管理引擎mgmt0鏈路 |
檢查備用管理引擎mgmt0鏈路狀態是否顯示。僅對運行NX-OS 9.2(1)及更高版本的MDS 9700導向器有效。 |
顯示版本 show interface mgmt0 standby |
16 |
MDS次優型PC成員分配檢查 |
埠通道對於多交換機光纖通道SAN的恢復能力非常重要。為最大容錯和硬體資源利用率配置埠通道有助於提高SAN的恢復能力。此模組檢查詢到的每個光纖通道埠通道,以確保其成員介面儘可能均勻地分佈在交換機中的可用模組和轉發引擎上。 |
顯示版本 show interface brief |
17 |
MDS FSPF一致性檢查 |
檢查每個ISL上的FSPF成本,以確保相鄰交換機具有相同/一致的成本。如果ISL兩端的成本不同,則可能會發生意外或非對稱路由。此檢查不適用於處於NPV模式的交換機,因為這些交換機中沒有FSPF資料庫。 |
show switchname show fspf database show fcs ie show npv internal info |
18 |
MDS高CPU使用率檢查 |
通過檢查多個命令輸出,驗證當前CPU使用率是否在預定限制範圍內。如果使用率超過60%,則通知使用者;如果使用率超過80%,則通知使用者;如果使用率超過90%,則警告使用者。 |
show processes cpu show processes cpu history show logging log |
19 |
MDS高記憶體利用率檢查 |
檢查幾個不同的命令輸出,以確定當前記憶體使用率是否小於配置的閾值,或者是否有任何進程正在分配的記憶體限制內運行。如果使用率超過90%,則通知使用者。 |
顯示版本 show processes memory show running-config |
20 |
MDS檢查埠監控Tx-Datarate配置以檢測過度使用 |
檢查活動埠監控策略,確定tx-datarate和/或tx-datarate-burst計數器是否配置為正確檢測過度使用。 |
顯示版本 show interface brief show running-config |
報告和警告
- 運行狀況和配置檢查SR是自動執行的,由虛擬TAC工程師處理。
- 報表(PDF格式)通常在24個工作小時內從所有必要的日誌附加到SR後生成。
- 報告將通過電子郵件(源自Cisco TAC自動電子郵件<no-reply@cisco.com>)自動與服務請求相關的所有聯絡人(主要和輔助)共用。
- 此報告也會附加到Service Request中,以便以後隨時可用。
- 請注意,報告中列出的問題基於提供的日誌,並且屬於表1(之前所示)中列出的運行狀況檢查模組的範圍。
- 所執行的運行狀況和配置檢查的清單並非詳盡無遺,建議使用者根據需要執行進一步的運行狀況檢查。
- 隨著時間的推移,可以新增新的運行狀況和配置檢查。
常見問題
問題1:是否可以上傳同一SR中多台交換機的show tech-support details以獲取所有交換機的運行狀況檢查報告?
A1:這是一個自動案例處理,運行狀況檢查由虛擬TAC工程師執行。運行狀況檢查僅針對上傳的第一個show tech-support details完成。
問題2:是否可以上傳同一裝置的多個顯示技術支援詳細資訊(例如,每隔幾個小時捕獲),以便完成兩者的運行狀況檢查?
回答2:這是由虛擬TAC工程師執行的自動和無狀態案件處理,且無論上傳的檔案是來自同一交換器還是不同交換器,都會對上傳到SR的第一個顯示技術支援詳細資訊檔案進行健康狀況與設定檢查。
問題3:如果交換機的show tech-support details檔案被壓縮為單個rar/gz檔案並上傳到SR,我能否對其進行運行狀況檢查?
回答3:否。如果多個show tech support details作為單個rar/zip/gz檔案上傳,則只會處理存檔中的第一個檔案以進行運行狀況檢查。
問題4:如果對報告的某個運行狀況檢查失敗有疑問,該怎麼做?
解答4:請開啟單獨的TAC服務請求,以獲得有關特定運行狀況檢查結果的進一步幫助。強烈建議附加運行狀況檢查報告,並參閱為自動運行狀況和配置檢查開啟的服務請求(SR)案例編號。
問題5:我是否可以使用為自動運行狀況和配置檢查開啟的相同SR來排除發現的問題?
A5:否。由於主動運行狀況檢查已自動化,請開啟新的Service Request以排除故障並解決報告的問題。請注意,為運行狀況檢查而開啟的SR會在運行狀況報告發佈後的24小時內關閉。
問題6:自動運行狀況和配置檢查是否針對運行比前面提到的版本舊版本的交換機的show tech-support details檔案運行?
A6:針對前面提到的平台和軟體版本構建自動運行狀況和配置檢查。對於運行較舊版本的裝置,這是盡力而為,並且不能保證報告的準確性。
問題7:如何關閉為運行狀況檢查開啟的SR?
解答7:在傳送第一個運行狀況檢查報告後24小時內關閉SR。無需使用者對SR關閉執行任何操作。
問題8:如何共用有關主動運行狀況和配置檢查的評論或反饋?
回答8:通過電子郵件將其共用到MDS-HealthCheck-Feedback@cisco.com
問題9.建議使用什麼方法從交換機捕獲show tech-support或show tech-support details?
A9:如本文檔前面所述,從NX-OS 8.4(2d)和9.2(1)開始,MDS tac-pac命令已得到增強,可在bootflash上快速建立包含顯示技術支援詳細資訊和附加show logging的文件。這是為需要顯示技術支援詳細資訊(包括自動運行狀況和配置檢查)的任何TAC服務請求(SR)建立輸入檔案的首選方法。捕獲到終端應用程式(例如SecureCRT、PuTTY)中日誌檔案的CLI輸出可以採用UTF-8-BOM格式(或類似格式),而自動運行狀況檢查不支援此格式。自動運行狀況和配置檢查僅支援ASCII或UTF-8格式的檔案。
執行Nexus運行狀況和配置檢查
請參閱執行Nexus運行狀況和配置檢查。
意見回饋
歡迎您就這些工具的操作提出任何反饋。如果您有任何意見或建議(例如,有關生成的報告的易用性、範圍、品質等),請在此處共用這些意見MDS-HealthCheck-Feedback@cisco.com。