簡介
本檔案介紹幾個路由和平台相關問題,以及從IOS和IOS-XE路由器收集相關資料、偵錯或show命令的步驟。事先在技術援助中心(TAC)服務請求(SR)上提供此資訊,有助於您順利解決問題。
必備條件
需求
思科建議您瞭解以下主題:
- 基本瞭解IOS和IOS-XE路由器上的傳統路由功能
- 要求使用者具有命令列介面(CLI)訪問許可權或實際操作IOS和IOS-XE路由器
採用元件
本檔案中的資訊是根據以下平台:
- ASR1000
- ISR4000
- ISR1000
- CSR1000v
- 傳統IOS平台(ISRG1/G2)
請求的基本資訊
- 問題是什麼時候開始的?
- 是什麼引發了問題?
- 記錄問題出現之前所做的任何最新更改。
- 請注意可能已觸發問題啟動的任何特定操作或事件。
- 問題的發生頻率是多少?
- 這是一次性事件嗎?
- 如果不是,問題發生的頻率是多少?
- 這是否與任何其他網路事件或操作相對應?
- 有多少使用者受到影響/業務影響?
- 您自己執行過任何故障排除(解釋步驟)?
- 相關裝置的拓撲結構是什麼/如何?
路由器和IOS-XE架構
下面是IOS和IOS-XE路由器上報告的一些常見問題,以及每個路由器的有用輸出,這些輸出應與「Show Tech」一起收集。
這些輸出有助於我們確保在該問題發生期間收集相關資料。如果問題不是永續性的,則尤其如此,這意味著問題可能會在TAC投入使用時消失。
IOS-XE意外重新載入
問題報告:裝置上出現意外重新載入或崩潰。除了對Base Information Requested部分的反饋之外,我們還需要以下內容:
- 收集「show tech」
- 檢查Bootflash/Harddisk並收集任何崩潰或核心檔案(如果生成):
Router#show bootflash: |崩潰
Router#show bootflash: |核心
- 將tracelogs存檔到bootflash並收集它。跟蹤檔案用於儲存跟蹤資料。這可能需要幾分鐘才能被收集。
Router#request platform software trace rotate all
Router#request platform software trace slot rp active archive target bootflash:
- 問題期間的外部系統日誌資料。
我們還可以選擇收集在看到Crash(16.11.x及更高版本)後在bootflash中自動建立的系統報告套件。系統報告捆綁包將收集更多資訊,如下所示:
- 跟蹤日誌
- 栗色統計資訊
- 核心/崩潰檔案
- RP/青色日誌
附註: 在16.11及更高版本上進一步增強可維護性後,一旦裝置發生崩潰,它會自動收集「系統報告」捆綁包。
Router#sh bootflash: |在sys中
12 2020年10月20日45 05:08:05.0000000000 +00:00 /bootflash/core/system-report_20201020-050805-UTC.tar.gz <<<
IOS-XE啟動失敗
問題報告:觀察到裝置中任何元件的啟動故障。有時,可能是RP(路由處理器)陷入啟動循環,從而無法登入裝置。
- 如果您可以登錄到裝置,請收集「show tech」
- 連線到Console並收集「Console日誌」。
- 提供LED狀態資訊。
附註:如果無法登入裝置,這一點至關重要
- 如果可以訪問站點,請嘗試重新拔插模組(例如RP、ESP或SIP/SPA)並收集控制檯日誌。
- 如果除RP以外的任何其他模組出現引導故障,請登入裝置,然後使用下面的命令嘗試軟體日誌並收集「show logging」
Router#hw-module slot <slot-num> reload
Router#hw-module subslot <slot-num/subslot num> reload
IOS-XE軟體版本選取協助
問題報告:需要升級裝置上的IOS,並且在選擇一個IOS時需要幫助。
- 在這些情況下,我們需要登入CCO頁面,並檢查特定平台的建議版本(星型標籤)。
- 或者,如果您要查詢IOS-XE路由器的建議,則可以使用以下連結:
- 如果我們需要有關從3.x升級到16.x版的IOS升級的幫助,可以參閱以下連結:
IOS-XE記憶體洩漏
問題報告:裝置上出現記憶體相關問題。有時,我們可能會遇到一些與特定元件的高記憶體利用率相關的錯誤。本部分綜合了排除記憶體洩漏或監控IOS-XE路由器上的記憶體時最有用的命令。
有關IOS-XE記憶體使用情況的常規說明,請參閱:
通過最近的一些可維護性工作,我們可以收集16.9.x版本及更高版本的「Show Tech Memory」。
- 如果您能夠登入裝置,請收集「Show tech」命令。
- show platform software status control-processor brief
- show platform software process list rp active sort memory
- show platform software process memory rp active all sort
- show platform software process slot rp active monitor cycles 2
- show platform software process list fp active summary
- show platform software process slot fp active monitor cycles 2
- show platform hardware qfp active infrastructure exmem statistics
- show platform hardware qfp active infrastructure exmem statistics user
- show platform hardware qfp active tcam resource-manager usage
- show platform hardware qfp active classification feature tcam-usage
- show platform hardware qfp active classification class-group-manager class-group all
在16.2及更高版本中引入的最近可維護性後,即可收集新cli:
- 顯示平台資源
- show memory platform
- show process memory platform sorted
- show process cpu platform monitor cycles 2
- show process memory platform sorted location fp active
附註:我們說「循環2」,因為第一組值將不準確
IOS-XE ISSU升級
問題報告:ISSU代表系統從一個版本到另一個版本的完整或部分軟體升級,轉發平面中斷最小(資料包丟失最小),控制平面無中斷。本節重點幫助您進一步升級ISSU:
IOS-XE裝置許可
問題報告:裝置上的許可有問題。最常見的問題包括「許可證未安裝」、許可證檔案未被視為永久等。本節將重點介紹我們解決許可證問題可能需要的最少輸出:
- 顯示技術支援許可證
附註:此命令通過後期代碼的可維護性引入(對於ASR1K :16.9.x和ISR4K:16.12.x)。
- 顯示全部許可證
- 顯示許可證版本
- 顯示許可證摘要
- 顯示許可證狀態
- 顯示許可證使用情況
- show license udi
路由協定問題
下面是IOS和IOS-XE路由器上報告的一些常見問題,以及每個路由器的有用輸出,這些應該在「Show Tech」之外進行收集。
這些輸出有助於我們確保在該問題發生期間收集相關資料。如果問題不是永續性的,則尤其如此,這意味著問題可能會在TAC投入使用時消失。
BGP/EIGRP/OSPF/靜態路由
問題報告:對於路由協定的故障排除,主要取決於我們要調查的問題型別,以及按照「請求的基本資訊」部分提供儘可能多的資料,應該是重點區域。除了它和「Show tech」之外,我們還可以收集協定特定輸出,如下所示:
BGP |
Show tech-support bgp |
EIGRP |
Show ip eigrp events Show ip eigrp interfaces Show ip eigrp neighbors Show ip eigrp topology Show ip eigrp traffic |
OSPF |
Show tech-support ospf |
靜態路由 |
顯示技術支援 |
注意:"show tech bgp"已引入某些較新版本,因此如果您運行的IOS未運行此命令,請通過「已請求的基本資訊」部分提供同樣多的資訊。
我們還可以選擇使用以下內容為一些常見場景執行基於流的BGP故障排除:
EIGRP鄰居翻動問題:
問題報告:這是EIGRP最常見的問題之一,其中存在鄰居翻動問題。我們可以利用EEM指令碼在發現問題時準確收集輸出和調試:
路由器上的NAT/PAT(網路/埠地址轉換)
在IOS-XE平台上,IOS NAT子系統接收並處理NAT配置,並通過轉發管理器(FMAN)和客戶端元件下載到QFP。NAT會話的建立和管理僅在QFP以及任何報頭和負載轉換上完成。在IOS-XE路由器上,NAT轉換不會傳送資料包。QFP還生成了傳送回IOS的狀態,如ipalias、靜態路由和wlan會話資訊。
問題報告:裝置上出現NAT/PAT相關問題。例如,NAT不會觸發或我們無法看到轉換和流量不會從內部傳遞到外部,反之亦然。由於硬體轉送資料封包,IOS-XE上的NAT/PAT問題有時可能有點棘手。本部分綜合了排除IOS-XE路由器上的NAT問題時使用的最有用的命令。
- show tech-support nat
注意:此輸出最近通過16.9.x版本及更高版本中的可維護性引入。
獨立於平台的Show命令
- show ip nat statistics
- show ip nat translation
我們也可以選擇使用「show ip nat translation」運行某些過濾器,如下所示:
- show ip nat translation udp total
- show ip nat translation inside
- show ip aliases
平台相關的Show命令
- show platform hardware qfp active statistics drop | exc _0 <<<檢查是否有任何NAT相關丟棄
- show platform hardware qfp active feature nat datapath map
- show platform hardware qfp active feature nat datapath port
- show platform hardware qfp active feature nat datapath pool
- show platform hardware qfp active feature nat datapath stat
- show platform hardware qfp active feature nat datapath base
- show platform hardware qfp active infrastructure exmem statistics user
- show platform hardware qfp active infrastructure exmem stat
- show platform hardware qfp active feature nat datapath gatein
- show platform hardware qfp active feature nat datapath gateout
iWAN
iWAN是一個複雜的解決方案,故障排除可能會變得更加複雜。iWAN中涉及許多元件,如DMVPN、IPSEC、傳輸(MPLS/INET)、PFR、EIGRP SAF。有關iWAN的不同問題可能與一個或多個元件有關。在iWAN網路中,所有裝置都扮演「主控制器」(MC)或「邊界路由器」(BR)的角色,為了解決iWAN問題,我們需要從這兩台路由器獲取詳細資訊。
問題報告:如果iWAN遇到以下任何問題,請捕獲各自裝置的給定命令清單。
- 未正確分發站點字首/服務路由
- 未建立EIGRP SAF對等
- 未建立流量通道
- 出現頻繁的TCA日誌
- 流量不是從特定傳輸流出
以下是需要擷取的命令清單。
MC — 主控制器
- show tech-support
- show domain IWAN master discovered-sites
- show domain IWAN master site-capability
- 顯示域IWAN主狀態
- show domain IWAN master site-prefix
- show domain IWAN master policy
- show domain IWAN master peering
- show domain IWAN master traffic-classes summary
- show platform hardware qfp active feature pfrv3 datapath global
- show eigrp service-family ipv4 neighbors
- show eigrp service-family ipv4 subscriptions detail
- show eigrp service-family ipv4 topology
- show eigrp service-family ipv4 traffic
- show derived-config | sec router eigrp
BR — 邊界路由器
- show tech-support
- show domain IWAN border site-capability
- show domain IWAN master site-capability
- show domain IWAN border parent-route
- show domain IWAN border channels dscp default
- show domain IWAN border channels
- show domain IWAN border traffic-classes summary
- 顯示域IWAN主狀態
- show domain IWAN master policy
- show domain IWAN border peering
- 顯示域IWAN邊界狀態
- show domain IWAN border pmi
- show performance monitor cache monitor
- show platform hardware qfp active feature pfrv3 datapath global
- show eigrp service-family ipv4 neighbors
- show eigrp service-family ipv4 subscriptions detail
- show eigrp service-family ipv4 topology
- show eigrp service-family ipv4 traffic
- show derived-config | sec router eigrp
其他錯誤日誌
下面是IOS和IOS-XE路由器上報告的一些常見日誌以及每個路由器的有用輸出,這些日誌應作為「Show Tech」以外的內容收集。
這些輸出有助於我們確保在該問題發生期間收集相關資料。如果問題不是永續性的,則尤其如此,這意味著問題可能會在TAC投入使用時消失。
與%FMFP-3-OBJ_DWNLD_TO_DP_STUCK相關的錯誤
- 從日誌消息中獲取對象ID:
範例:
%FMFP-3-OBJ_DWNLD_TO_DP_STUCK:R0/0:fman_fp_image:obj[20] type[215] pending-issue Req-create Issued-noneSSLMGR的AOM下載:輔助初始化資料平面停滯超過1800秒
- 此示例中的對象ID為obj[20],將用作20
- 使用步驟2中獲得的數字捕獲替換「<object_id>」欄位的命令:
- show platform software object-manager f0 object <object_id>
- show platform software object-manager f0 object <object_id> parents
- show platform software object-manager f0 object <object_id> children
- show platform software object-manager f0 object <object_id>下載連結
- 捕獲以下不需要對象ID的命令:
- show platform software object-manager f0 statistics
- show platform software object-manager f0 pending-issue-update
- show platform software object-manager f0 pending-ack-update
- show platform software object-manager f0 object-type-count
- show platform software object-manager f0 error-object
- show platform software object-manager f0 resolve-object
- show platform software object-manager f0 stale-object
- show platform software object-manager f0 paused-object-type