Introduction
Ce document décrit le fonctionnement de l'utilisation des ressources d'une tâche dans StarOS et fournit une liste des journaux qui doivent être collectés pour dépanner les événements d'utilisation élevée du CPU/de la mémoire/du fichier. Sur StarOS, le sous-système de gestion des ressources (resctrl / resmgr) attribue un ensemble de limites de ressources pour chaque tâche du système. Il surveille l'utilisation des ressources de chaque tâche afin de s'assurer qu'elle reste dans la limite. Lorsqu'une tâche a dépassé ses limites, les interruptions Syslog ou SNMP (Simple Network Management Protocol) sont générées pour notifier les opérations réseau.
Mécanisme de surveillance des ressources
Il y a beaucoup de tâches exécutées sur StarOS, par exemple sessmgr/aamgr/vpnmgr et ainsi de suite. Chaque tâche est définie comme une limite pour l'utilisation du CPU/de la mémoire/des fichiers et les limites sont surveillées par la gestion des ressources. Les limites peuvent être différentes selon le type de tâche (sessmgr et aamgr ont des limites différentes), la version StarOS et le type de matériel. En outre, les limites sont définies par le système et ne sont pas configurables par les utilisateurs.
La description de chaque tâche sur StarOS se trouve dans le chapitre Tâches StarOS du Guide d'administration du système.
Les informations de base sur l'utilisation des ressources se trouvent dans le résultat de show task resources
Commande CLI.
Champ |
Description |
cputime utilisé |
Utilisation du CPU pour la tâche |
cputime allc |
Limite d'utilisation CPU allouée pour la tâche |
mémoire utilisée |
Utilisation de la mémoire de la tâche |
mémoire alloc |
Limite d'utilisation de la mémoire allouée pour la tâche |
fichiers utilisés |
Utilisation des fichiers de la tâche |
fichier allc |
Utilisation des fichiers alloués de la tâche |
status (état) |
État de la tâche : bon / avertissement / supérieur |
Il est important de comprendre que l'objectif est de surveiller les ressources et ne limite pas la fonctionnalité des tâches. La tâche doit pouvoir fonctionner même après avoir consommé plus de CPU/mémoire/fichiers que la limite. Les interruptions Syslog et SNMP sont générées lorsque la limite est franchie, mais elles n'indiquent pas toujours un problème.
Cause suspectée
Dans de nombreux cas, un pic d'utilisation temporaire n'est pas un problème. Mais s'il est persistant, par exemple, l'utilisation du CPU d'une tâche reste à 100 % ou l'utilisation de la mémoire continue à augmenter et ne peut jamais être réduite, de tels cas doivent être examinés.
Les causes typiques d'une pointe temporaire sont les suivantes :
- Commande CLI qui génère une sortie énorme (tâche CLI)
- Quantité d'informations de journal conservées dans le système (tâche evlogd)
Les cas qui doivent faire l'objet d'une enquête sont les suivants :
- Utilisation élevée du CPU causée par la boucle infinie interne (utilisation du CPU maintenue à 100 %)
- L'augmentation constante de l'utilisation de la mémoire par une fuite ou une fragmentation de la mémoire
Les exemples de déroutements SNMP dans les fonctions sessmgr, npudrv et CLI sont présentés ici :
Mon Aug 26 11:32:19 2013 Internal trap notification 1221 (MemoryOver) facility sessmgr instance 16 card 1 cpu 0 allocated 204800 used 220392
Mon Aug 26 11:32:29 2013 Internal trap notification 1222 (MemoryOverClear) facility sessmgr instance 16 card 1 cpu 0 allocated 1249280 used 219608
Fri Dec 20 13:52:20 2013 Internal trap notification 1217 (MemoryWarn) facility npudrv instance 401 card 5 cpu 0 allocated 112640 used 119588
Fri Dec 20 14:07:26 2013 Internal trap notification 1218 (MemoryWarnClear) facility cli instance 5011763 card 5 cpu 0 allocated 56320 used 46856
Wed Dec 25 12:24:16 2013 Internal trap notification 1220 (CPUOverClear) facility cli instance 5010294 card 5 cpu 0 allocated 600 used 272
Wed Dec 25 12:24:16 2013 Internal trap notification 1216 (CPUWarnClear) facility cli instance 5010294 card 5 cpu 0 allocated 600 used 272
Wed Dec 25 17:04:56 2013 Internal trap notification 1215 (CPUWarn) facility cli instance 5010317 card 5 cpu 0 allocated 600 used 595
Wed Dec 25 17:05:36 2013 Internal trap notification 1216 (CPUWarnClear) facility cli instance 5010317 card 5 cpu 0 allocated 600 used 220
Utilisation du processeur
Lorsque l'utilisation de la tâche CPU est proche ou supérieure à la limite, les interruptions SNMP CPUWarn et CPUOver sont générées avec l'avertissement Syslog.
Interruptions SNMP
Internal trap notification 1215 (CPUWarn) facility sct instance 0 card 8 cpu 0 allocated 500 used 451
Internal trap notification 1219 (CPUOver) facility cli instance 5010046 card 5 cpu 0 allocated 600 used 609
Dans l'exemple CPUOver, le numéro d'instance 5010046 consomme 60,9 % d'utilisation du CPU alors que la limite est de 60 %.
Syslog
[resmgr 14502 warning] [2/0/2352
_resource_cpu.c:2876] [software internal system] The task ipsecmgr-202 is over it's cputime limit. Allocated 50.0%, Using 51.8%
Note: Ce Syslog est un niveau d'avertissement et n'est pas généré avec le paramètre de journalisation par défaut. Si cela doit être généré, le paramètre de journalisation de resmgr doit être configuré comme avertissement.
Utilisation de la mémoire
Lorsque l'utilisation des tâches de mémoire est proche ou supérieure à la limite, les interruptions MemoryWarn et MemoryOver SNMP sont générées avec l'avertissement Syslog.
Interruptions SNMP
Internal trap notification 1217 (MemoryWarn) facility cli instance 5005588 card 5 cpu 0 allocated 66560 used 70212
Internal trap notification 1221 (MemoryOver) facility cli instance 5010046 card 5 cpu 0 allocated 66560 used 89940
Dans l'exemple MemoryOver, le numéro d'instance 5010046 consomme 89940 de mémoire alors que la limite est 66560.
Syslog
[resmgr 14500 warning] [8/0/4054
_resource_cpu.c:3622] [software internal system syslog] The task bulkstat-0 is over its memory limit. Allocated 46080K, Using 48120K
Note: Ce Syslog est un niveau d'avertissement et n'est pas généré avec le paramètre de journalisation par défaut. Si cela doit être généré, le paramètre de journalisation de resmgr doit être configuré comme avertissement.
Utilisation des fichiers
Les files
indique le nombre de fichiers ouverts ou la tâche de descripteur de fichier utilise. Il n'y a pas de déroutement SNMP pour l'utilisation du fichier, mais un Syslog est généré lorsque la limite est franchie.
2013-May-28+14:16:18.746 [resmgr 14517 warning] [8/0/4440
_resource_cpu.c:3558] [software internal system syslog] The task cli-8031369 is over its open files limit. Allocated 2000, Using 2499
Informations nécessaires au dépannage des problèmes
Cette section décrit les informations à collecter avant d'ouvrir une nouvelle demande de service du centre d'assistance technique (TAC) lorsque des recherches supplémentaires sont nécessaires. Le journal qui doit être collecté est différent selon le type d'utilisation.
Note: Outre la liste des commandes, le résultat de la commande show support detail
est toujours nécessaire.
Utilisation du processeur
Entrez ces commandes dans l’interface de ligne de commande StarOS et capturez le résultat :
show task resources
show task resource max
show snmp trap history
show logs
show profile facility
instance
depth 4
Note: Les show profile
est une commande CLI en mode caché.
Utilisation de la mémoire
Entrez ces commandes dans l’interface de ligne de commande StarOS et capturez le résultat :
show task resources
show task resource max
show snmp trap history
show logs
Collectez plusieurs fois les commandes de tas et de tas système à intervalles réguliers, par exemple toutes les 15 minutes et quatre sorties.
show messenger proclet facility
instance
heap
show messenger proclet facility
instance
system heap
Note: Les show messenger proclet
commande d'une interface de ligne de commande en mode caché.
Utilisation des fichiers
Entrez ces commandes dans l’interface de ligne de commande StarOS et capturez le résultat :
show task resources
show task resource max
show snmp trap history
show logs