Introduzione
In questo documento viene descritto come risolvere i problemi relativi allo spegnimento anomalo sui sistemi basati su VOS (Voice Operating System).
Prerequisiti
Requisiti
Cisco raccomanda la conoscenza di uno o più dei seguenti argomenti:
- Cisco Unified Communications Manager (CUCM)
- Messaggistica istantanea e presenza (IM&P) Cisco Unified
- Cisco Emergency Responder (CER)
- Cisco Unity Connection (CUC)
Componenti usati
Le informazioni fornite in questo documento si basano sulle seguenti versioni software e hardware:
- CUCM 12.5 o superiore
- IM&P 12.5 o superiore
- CER 12.5 o superiore
- CUC 12.5 o superiore
Le informazioni discusse in questo documento fanno riferimento a dispositivi usati in uno specifico ambiente di emulazione. Su tutti i dispositivi menzionati nel documento la configurazione è stata ripristinata ai valori predefiniti. Se la rete è operativa, valutare attentamente eventuali conseguenze derivanti dall'uso dei comandi.
Che cos'è un arresto anomalo?
Per arresto anomalo si intende l'arresto improvviso o brusco di VOS senza che vengano eseguite le procedure corrette. Si verifica in genere quando il sistema viene arrestato o spento in modo imprevisto, senza consentire l'arresto normale dei processi e dei servizi necessari.
Quando si verifica un arresto anomalo, sul sito Web di amministrazione dei server viene visualizzato un messaggio di avviso.
Avviso di arresto anomalo dell'interfaccia Web
Questo avviso viene visualizzato anche se si accede tramite SSH o VMWare Console.
CLI di arresto anomalo
Le cause più comuni degli arresti anomali includono:
- Interruzioni dell'alimentazione
- Guasti hardware
- Procedure non corrette di arresto, riavvio o interruzione della macchina virtuale
Avviso: arresti anomali possono causare interruzioni del servizio, perdita di dati e instabilità del sistema.
Verifica di un evento di arresto anomalo
Per confermare che si è verificato un arresto anomalo, accedere alla CLI ed eseguire la vista file install system-history.log.
Esaminare l'output del file system-history.log. Se due eventi di avvio sono consecutivi senza un evento di arresto o riavvio di procedura, si è verificato un arresto anomalo.
admin:visualizzazione file install system-history.log
20/06/2023 10.22.48 | root: shutdown 14.0.1.13900-155 Start
20/06/2023 10:24:35 | root: Boot 14.0.1.13900-155 Start = OK, Previous Shutdown
10/07/2023 10:29:08 | root: riavviare 14.0.1.13900-155 Start
10/07/2023 10.30.05 | root: Boot 14.0.1.13900-155 Start = OK, Prior Restart
15/07/2023 11:14:29 | root: Boot 14.0.1.13900-155 Start = Arresto anomalo, nessuna istruzione di riavvio o arresto precedente
Convalida integrità sistema
È importante identificare la causa alla base di un arresto anomalo al fine di adottare misure appropriate per prevenirne il ripetersi e ridurre al minimo l'impatto sul sistema e sui suoi utenti.
Verifica alimentazione
Verificare che il server VOS disponga di un alimentatore stabile e sia collegato correttamente alle fonti di alimentazione. Accertarsi che i cavi di alimentazione siano collegati saldamente e non danneggiati.
Verifica hardware
Accedere ai server Integrated Management Controller (IMC) o Integrated Dell Remote Access Controller (iDRAC) per esaminare i registri del server.Esaminare i registri del server per individuare eventuali errori o avvisi relativi all'hardware che indicano problemi con i componenti hardware.
Molti server offrono strumenti di diagnostica accessibili durante il processo di avvio. Questi strumenti consentono di eseguire test completi dell'hardware, inclusi test della memoria, della CPU e del disco. Utilizzare questi strumenti di diagnostica per identificare eventuali problemi o guasti hardware.
Nota: è importante consultare la documentazione dei produttori di server e le risorse di supporto per istruzioni specifiche su come verificare e risolvere i problemi relativi all'hardware.
Verifica procedura di arresto
L'arresto forzato del server VOS mediante metodi quali la pressione del pulsante di alimentazione o lo scollegamento del server senza consentire al sistema operativo di eseguire i processi di arresto necessari può causare un arresto anomalo.
Controlli di stabilità VOS
Per verificare la stabilità del sistema VOS, è possibile utilizzare diverse utilità. Queste utility forniscono informazioni importanti su servizi, diagnostica, rete, integrità del database e sincronizzazione dell'ora.
Utilità |
Descrizione |
utils service list |
Questo comando VOS viene utilizzato per controllare lo stato e l'integrità dei servizi in esecuzione sul server. L'esame dell'elenco dei servizi garantisce che tutti i servizi essenziali vengano eseguiti come previsto. Tutti i servizi arrestati o che presentano problemi possono indicare potenziali problemi di stabilità nel sistema. |
utils diagnose test |
Questo comando VOS avvia un test di diagnostica che esegue vari controlli su componenti, configurazioni e servizi del sistema. Consente di identificare potenziali problemi o configurazioni errate che potrebbero influire sulla stabilità del sistema. L'output di diagnostica fornisce agli amministratori informazioni di diagnostica e consigli per la risoluzione dei problemi identificati. |
mostra cluster di rete |
Questo comando VOS verifica la connettività di rete tra i nodi del cluster e visualizza lo stato di ciascun membro del cluster. Gli amministratori possono esaminare i dati di output per verificare che la rete sia configurata correttamente, che tutti i membri del cluster siano in linea e che la comunicazione tra di essi sia stabile. Problemi o incoerenze di rete possono influire in modo significativo sulla stabilità e l'affidabilità del sistema VOS. |
mostra integrità dbtech |
Questo comando VOS genera un file di supporto tecnico che include informazioni sull'integrità del database. Verifica lo stato della replica, i contatori e altri dettagli importanti relativi al database. La verifica dell'integrità del database è fondamentale per garantire la coerenza dei dati e la stabilità del sistema. Tutti i problemi rilevati da questo comando possono contribuire all'identificazione e alla risoluzione di potenziali problemi del database. |
stato ntp utils |
Questo comando VOS visualizza lo stato di sincronizzazione NTP (Network Time Protocol) sul server. Indica l'origine NTP in uso, lo stato della sincronizzazione e lo scostamento temporale tra il server e l'origine NTP configurata. La corretta sincronizzazione dell'ora è essenziale per varie funzioni del sistema. La verifica dello stato NTP garantisce che l'ora dei sistemi VOS sia accurata e riduce al minimo i potenziali problemi relativi ai tempi. |
Controllo file ISO di ripristino |
Questa utilità ISO viene utilizzata per esaminare e verificare l'integrità del file system sul server VOS. Eseguire il controllo dei file per verificare che il file system sia integro e privo di danneggiamenti o errori. La verifica dei file non copre l'integrità dei singoli file che potrebbero contenere elementi danneggiati Per informazioni sul download e l'utilizzo dell'ISO di ripristino, consultare la guida Ottieni ed esegui software di ripristino sulla VM CUCM. |
Attenuazione
Per ridurre l'impatto di arresti anomali è importante implementare misure preventive, quali backup regolari, monitoraggio e strategie di ridondanza.
Se durante le attività di manutenzione, gli aggiornamenti del sistema, il riavvio della macchina virtuale o l'arresto della macchina virtuale non vengono seguite le procedure di arresto appropriate, è possibile che si verifichi un arresto anomalo.
Correzione
La soluzione consigliata per un arresto anomalo a livello di VOS consiste nel ricostruire i nodi interessati e nel eseguire il ripristino da un backup valido. In questo modo viene garantita l'integrità dei file del sistema e viene ripristinato lo stato stabile del sistema.
Fare riferimento ai collegamenti forniti per Istruzioni su come ripristinare da un backup.
C'è un'altra opzione disponibile in situazioni in cui la ricostruzione non è possibile o sfavorevole. Il comando VOS utilizza ungraceful warn disable per eliminare gli avvisi di arresto anomalo di Amministrazione Web e Console.
Comando |
Descrizione |
utils ungraceful warn disable |
Questo comando vos può essere utilizzato per disattivare il messaggio di avviso di Amministrazione Web e Console che viene visualizzato quando viene rilevato un arresto anomalo. Questo comando non esegue alcun controllo del sistema per rilevare eventuali danneggiamenti dei file. |
Questa non è la soluzione consigliata in quanto si limita a eliminare l'avviso e non risolve la causa sottostante dell'arresto anomalo. È fondamentale affrontare le cause profonde e garantire la stabilità e l'integrità del sistema VOS
Nota: se il server non è in grado di eseguire il comando utils ungraceful warn disable, consultare l'ID bug Cisco CSCvy68211 perché per abilitare il comando è necessario un file COP.