In questo documento viene descritta la procedura da seguire per monitorare e risolvere i problemi relativi all'utilizzo elevato del processore su Cisco Unified Communications Manager 6.0 con RTMT.
Cisco raccomanda la conoscenza di questo argomento:
Cisco Unified Communications Manager
Le informazioni fornite in questo documento si basano sui seguenti punti all'ordine del giorno:
Identificazione del processo che utilizza la maggior parte della CPU
Identificazione del processo responsabile dell'I/O del disco
Codice giallo ma l'utilizzo totale della CPU è solo del 25% - Perché?
Il riferimento delle informazioni contenute in questo documento è Cisco Unified Communications Manager 6.0.
Le informazioni discusse in questo documento fanno riferimento a dispositivi usati in uno specifico ambiente di emulazione. Su tutti i dispositivi menzionati nel documento la configurazione è stata ripristinata ai valori predefiniti. Se la rete è operativa, valutare attentamente eventuali conseguenze derivanti dall'uso dei comandi.
Per ulteriori informazioni sulle convenzioni usate, consultare il documento Cisco sulle convenzioni nei suggerimenti tecnici.
L'utilizzo di RTMT per isolare potenziali problemi con la CPU può essere un passaggio molto utile per la risoluzione dei problemi.
Questi termini rappresentano l'utilizzo dei report Pagina CPU e memoria RTMT:
%Sistema: percentuale di utilizzo della CPU verificatasi durante l'esecuzione a livello di sistema (kernel)
%Utente: percentuale di utilizzo della CPU verificatasi durante l'esecuzione a livello utente (applicazione)
%IOWait: la percentuale di tempo di inattività della CPU durante l'attesa di una richiesta di I/O del disco in attesa
%SoftIRQ: la percentuale di tempo in cui il processore esegue l'elaborazione degli IRQ differiti (ad esempio, l'elaborazione dei pacchetti di rete)
%IRQ la percentuale di tempo in cui il processore esegue la richiesta di interrupt, assegnata ai dispositivi per l'interrupt, o invia un segnale al computer al termine dell'elaborazione
Gli avvisi CPUPegging/CallProcessNodeCPUPegging monitorano l'utilizzo della CPU in base alle soglie configurate:
Nota: %CPU viene calcolato come %system + %user + %nice + %iowait + %softirq + %irq
I messaggi di avviso includono:
%system, %user, %nice, %iowait, %softirq e %irq
Processo che utilizza la maggior parte della CPU
Processi in attesa della sospensione ininterrompibile del disco
Gli avvisi di pegging della CPU possono essere generati in RTMT a causa di un utilizzo della CPU superiore a quello definito come livello di limite. Poiché durante il caricamento la registrazione dettagli chiamata è un'applicazione che richiede un utilizzo intensivo della CPU, verificare se gli avvisi vengono ricevuti nello stesso periodo in cui la registrazione dettagli chiamata è configurata per l'esecuzione di report. In questo caso, è necessario aumentare i valori di soglia in RTMT. Per ulteriori informazioni sugli avvisi RTMT, fare riferimento a Avvisi.
Se %system e/o %user è abbastanza alto da generare l'avviso CpuPegging, controllare il messaggio di avviso per individuare i processi che utilizzano più CPU.
Nota: andare alla pagina Processo RTMT e ordinare per %CPU per identificare i processi con CPU elevata.
Nota: per l'analisi post-mortem, il registro PerfMon della risoluzione dei problemi RIS tiene traccia dell'utilizzo %CPU del processo e del livello di sistema.
%IOWait elevato indica attività di I/O su disco elevate. Tenere presente quanto segue:
IOWait è dovuto allo scambio di memoria intensivo.
Controllare il valore %CPU Time for Swap Partition per verificare se è presente un livello elevato di attività di scambio della memoria. Poiché Muster dispone di almeno 2G di RAM, lo scambio di memoria elevato è probabilmente dovuto a una perdita di memoria.
IOWait è dovuto all'attività del database.
Il database è principalmente l'unico che accede alla partizione attiva. Se il tempo %CPU per la partizione attiva è elevato, è probabile che l'attività del database sia elevata.
Partizione comune (o Log) indica la posizione in cui vengono archiviati i file di trace e di log.
Nota: verificare quanto segue:
Trace & Log Central: sono previste attività di raccolta di tracce? Se l'elaborazione delle chiamate è interessata, ovvero CodeYellow, modificare la pianificazione della raccolta di tracce. Inoltre, se viene utilizzata l'opzione zip, disattivarla.
Impostazione traccia: a livello Dettagliato, CallManager genera una traccia di una certa entità. Se lo stato di CodeYellow è impostato su %IOWait e/o CCM alto e l'impostazione della traccia del servizio CallManager è in Dettaglio, provare a modificarlo in "Errore".
Non esiste un modo diretto per scoprire l'utilizzo di %IOWait per processo. Attualmente, il modo migliore è controllare i processi in attesa sul disco.
Se %IOWait è abbastanza alto da causare un avviso di Pegging CPU, controllare il messaggio di avviso per determinare i processi in attesa di I/O su disco.
Andare alla pagina Processo RTMT e ordinare per stato. Verificare la presenza di processi nello stato di sospensione ininterrompibile del disco. Il processo SFTP utilizzato da TLC per la raccolta pianificata si trova nello stato di sospensione ininterrompibile del disco.
Nota: il file di log PerfMon per la risoluzione dei problemi RIS può essere scaricato per esaminare lo stato del processo per periodi di tempo più lunghi.
In Real Time Monitoring Tool (Strumento di monitoraggio in tempo reale), selezionare System > Tools > Trace > Trace & Log Central (Sistema > Strumenti > Trace > Trace & Log Central).
Fare doppio clic su Raccogli file e scegliere Avanti.
Selezionare Cisco RIS Data Collector PerfMonLog, quindi Avanti.
Nel campo Tempo di raccolta configurare il tempo necessario per visualizzare i file di registro per il periodo in questione. Nel campo Download File Options (Opzioni file di download), individuare il percorso di download (una posizione da cui è possibile avviare Performance Monitor di Windows per visualizzare il file di log), selezionare Zip Files (File ZIP), quindi scegliere Finish (Fine).
Prendere nota dello stato di avanzamento di Raccolta file e del percorso di download. Non devono essere segnalati errori.
Visualizzare i file di registro delle prestazioni con lo strumento Performance Monitor di Microsoft. Scegliere Start > Impostazioni > Pannello di controllo > Strumenti di amministrazione > Prestazioni.
Nella finestra dell'applicazione, fare clic con il pulsante destro del mouse e scegliere Proprietà.
Scegliere la scheda Origine nella finestra di dialogo Proprietà - Monitor di sistema. Scegli file di registro: come origine dati e fare clic sul pulsante Aggiungi.
Individuare la directory in cui è stato scaricato il file di log di PerfMon e scegliere il file csv di perfmon. Il file di log include la seguente convenzione di denominazione:
PerfMon_<nodo>_<mese>_<giorno>_<anno>_<ora>_<minuto>.csv; ad esempio, PerfMon_10.89.35.218_6_20_2005_11_27.csv.
Fare clic su Apply (Applica).
Fare clic sul pulsante Intervallo di tempo. Per specificare l'intervallo di tempo nel file di log di PerfMon che si desidera visualizzare, trascinare la barra sulle ore di inizio e di fine appropriate.
Per aprire la finestra di dialogo Aggiungi contatori, fare clic sulla scheda Dati e scegliere Aggiungi. Dalla casella di riepilogo a discesa Oggetto prestazione, aggiungere Process. Selezionate Stato processo (Process Status) e fate clic su Tutte le varianti (All instance). Al termine, fare clic su Chiudi.
Suggerimenti per la visualizzazione del registro:
Impostate la scala verticale del grafico su Massimo 6.
Concentrarsi su ciascun processo e osservare il valore Massimo di 2 o superiore.
Eliminare i processi che non sono in stato di sospensione ininterrompibile del disco.
Utilizzate l'opzione di evidenziazione.
Nota: Stato processo 2 = Sospensione ininterrotta del disco sospetta. Altre possibilità di stato sono 0-running, 1-sleep, 2-Uninterruptible disc sleep, 3-Zombie, 4-Traced o stop, 5-Paging, 6-Unknown
L'avviso di colore giallo codice viene generato quando il servizio CallManager passa allo stato giallo codice. Per ulteriori informazioni sullo stato giallo del codice, vedere Limitazione delle chiamate e stato giallo del codice. È possibile configurare l'avviso CodeYellow per il download dei file di traccia a scopo di risoluzione dei problemi.
Il contatore AverageExpectedDelay rappresenta il ritardo medio previsto corrente per la gestione dei messaggi in ingresso. Se il valore è superiore al valore specificato nel parametro del servizio "Latenza voce di codice giallo", viene generato l'allarme CodeYellow. Questo contatore può essere un indicatore chiave delle prestazioni di elaborazione delle chiamate.
È possibile che CallManager entri nello stato CodeYellow a causa della mancanza di risorse del processore quando l'utilizzo totale della CPU è solo intorno al 25-35% in una scatola di 4 processori virtuali.
Nota: con la tecnologia Hyper-Threading attivata, un server con due processori fisici dispone di quattro processori virtuali.
Nota: in modo analogo, in un server a due processori, CodeYellow è possibile con circa il 50% di utilizzo totale della CPU.
Se RTMT invia, lo stato del servizio è INATTIVO. Interfaccia di messaggistica Cisco. Avviso, è necessario disattivare il servizio Cisco Messaging Interface se CUCM non è integrato con un sistema di messaggistica vocale di terze parti. Se si disabilita il servizio Cisco Messaging Interface, vengono arrestati ulteriori avvisi da RTMT.
Revisione | Data di pubblicazione | Commenti |
---|---|---|
1.0 |
30-Jan-2009 |
Versione iniziale |