Introduzione
In questo documento vengono descritti i passaggi da completare per acquisire informazioni in caso di guasto o arresto anomalo di un sistema di Quantum Policy Suite (QPS). Se i requisiti hardware, software e macchina virtuale sono soddisfatti, è improbabile che il QPS si arresti in modo anomalo.
Prerequisiti
Requisiti
Nessun requisito specifico previsto per questo documento.
Componenti usati
Le informazioni fornite in questo documento si basano sulle seguenti versioni software e hardware:
- QPS release 5.5 e successive.
Nota: Alcuni registri non verranno visualizzati nelle versioni di QPS precedenti alla versione 5.5.
Le informazioni discusse in questo documento fanno riferimento a dispositivi usati in uno specifico ambiente di emulazione. Su tutti i dispositivi menzionati nel documento la configurazione è stata ripristinata ai valori predefiniti. Se la rete è operativa, valutare attentamente eventuali conseguenze derivanti dall'uso dei comandi.
Acquisisci informazioni
Se si verifica un errore di sistema QPS, raccogliere le seguenti informazioni:
Log di diagnostica e di debug
- Accedere alla macchina virtuale client PCRF (Policy and Charging Rules Function), ad esempio pcrfclient01, e raccogliere le informazioni di diagnostica, ad esempio /opt/broadhop/installer/diag/diagnostics.sh.
- Accedere alla macchina virtuale client PCRF e raccogliere le informazioni di debug. Le informazioni di debug includono il registro QNS consolidato, il repo svn e i dettagli di configurazione QNS. Verificare che i registri consolidati coprano l'ora dell'errore di sistema e che il livello di debug sia impostato nel file logback.xml.
- Raccogli questo output dal QPS (ad esempio, Esegui /opt/broadhop/installer/diag/zip_debug_info.sh e l'output viene archiviato in /var/tmp/debug_info<data>.zip).
Informazioni sulle licenze QPS
- Accedere alla macchina virtuale client PCRF e raccogliere le informazioni sulle licenze QPS. Un QPS è in genere concesso in licenza per una funzionalità specifica e supporta un numero massimo di sessioni simultanee. QPS ha anche una data di scadenza per questa funzione.
- Passare alla directory seguente: /etc/broadhop/license e acquisire l'output del file di licenza (.lic). (ad esempio, cat /etc/broadhop/license/QUANTUM201311210402429360.lic).
Statistiche di sistema
- Acquisire le statistiche del sistema (esempio: CPU, memoria, utilizzo del disco).
- Accedere alla macchina virtuale client PCRF e raccogliere l'output. Esempio: /opt/broadhop/control/top_qps.sh
- Accedere alla macchina virtuale corrispondente (ad esempio, pcrfclient0x, lb0x, qns0x) e acquisire le seguenti statistiche di sistema:
cat /proc/meminfo > Informazioni sulla memoria allocata
free -s 60 > Statistiche di memoria per ogni minuto
vmstat 1 > Stato CPU per ogni minuto
ps -aux | head -10 > Primi 10 dettagli processo che consumano la maggior parte dell'utilizzo della CPU
swapon -s > riepilogo utilizzo swap per dispositivo
. du -a | sort -n -r | head -n 10 > Primi 10 file/directory che occupano più spazio
- Accedere alla macchina virtuale di sessionmgr e raccogliere gli output mongostat e mongotop, che consentiranno di risolvere il problema se è correlato o meno al database.
Configurazione thread in Generatore criteri
Accedere a Policy Builder e selezionare Dati di riferimento > System-1 > Configurazioni plug-in > Configurazione thread.
Il numero di thread può variare da 40 a 50 per TPS, ma è inferiore a 1.000. Il numero massimo di thread che è possibile configurare è 50. Se si aumenta il numero di thread, le prestazioni del sistema ne risentiranno.
Registro errori irreversibili
Quando si verifica un errore di sistema, QPS genera un log degli errori irreversibili contenente lo stato del processo nel momento in cui si è verificato l'errore irreversibile. Errori irreversibili o eccezioni irreversibili provocano l'interruzione del programma.
Il log degli errori irreversibili include le seguenti informazioni:
- Eccezione o segnale operativo che ha provocato l'errore irreversibile
- Informazioni su versione e configurazione
- Dettagli sul thread che ha provocato l'errore irreversibile e analisi dello stack del thread
- Elenco dei thread in esecuzione e relativo stato
- Informazioni di riepilogo sull'heap
- Elenco delle librerie native caricate
- Argomenti della riga di comando
- Variabili di ambiente
- Dettagli sul sistema operativo e sull'unità di elaborazione centrale
Il nome del file di log di default è nel seguente formato: hs_err_pid<pid>.log e viene generato nella directory di lavoro in cui sono stati avviati i processi Java corrispondenti. Esempio: la directory di lavoro dell'utente quando l'utente ha avviato il processo QNS.
Se non si conosce la directory di lavoro, ricercare il file con il nome hs_err_pid*.log nel sistema ed esaminare il file per verificare la corrispondenza con il momento in cui si è verificato l'errore.
Completare questa procedura per specificare il percorso dell'errore irreversibile:
- Accedere alla macchina virtuale pcrfclient01
- Aprire jvm.conf (ad esempio,vi /etc/broadhop/pcrf/jvm.conf).
- Aggiungere l'opzione: -XX:ErrorFile=<directory>/<nome-file>%p.log all'elenco e verificare che il percorso di directory specificato esista e che il servizio QNS utente disponga dell'autorizzazione completa per tale directory. Esempio: -X:ErrorFile=/home/qns/fatal_error%p.log
- Il comando "syncconfig.sh" può causare molti problemi se i file conf in pcrfclient01:/etc/broadhop non sono sincronizzati con i file conf in /etc/broadhop sulle macchine virtuali che eseguono il servizio QNS. Il file syncconfig.sh acquisirà i file di configurazione pcrfclient01:/etc/broadhop e sovrascriverà i file di configurazione in /etc/broadhop sulle macchine virtuali che eseguono il QNS.
Avviso: Il comando synconfig.sh accetta i file di configurazione pcrfclient01:/etc/broadhop e sovrascrive tutti i file di configurazione in /etc/broadhop sulle macchine virtuali che eseguono il servizio QNS (ad esempio, iomgr01, iomgr02, qns01, qns02, ecc.)
- Riavviare l'applicazione QNS e immettere il comando restartall.sh