Dans le cadre de la documentation associée à ce produit, nous nous efforçons d’utiliser un langage exempt de préjugés. Dans cet ensemble de documents, le langage exempt de discrimination renvoie à une langue qui exclut la discrimination en fonction de l’âge, des handicaps, du genre, de l’appartenance raciale de l’identité ethnique, de l’orientation sexuelle, de la situation socio-économique et de l’intersectionnalité. Des exceptions peuvent s’appliquer dans les documents si le langage est codé en dur dans les interfaces utilisateurs du produit logiciel, si le langage utilisé est basé sur la documentation RFP ou si le langage utilisé provient d’un produit tiers référencé. Découvrez comment Cisco utilise le langage inclusif.
Cisco a traduit ce document en traduction automatisée vérifiée par une personne dans le cadre d’un service mondial permettant à nos utilisateurs d’obtenir le contenu d’assistance dans leur propre langue. Il convient cependant de noter que même la meilleure traduction automatisée ne sera pas aussi précise que celle fournie par un traducteur professionnel.
Ce document décrit le comportement d'épuisement de la durée de vie des disques durs SSD sur les plates-formes de commutation ACI (Application Centric Infrastructure).
Si vous avez atterri sur cette page à la suite d'une erreur SSD soulevée contre le contrôleur APIC (Application Policy Infrastructure Controller) (pas un noeud de commutateur), référez-vous à FN64329.
Le remplacement du SSD APIC documente la procédure de remplacement du SSD APIC.
Les noeuds leaf et spine ACI exploitent les disques SSD pour le stockage et la journalisation des événements. Tous les disques SSD, quel que soit le type de fournisseur, ont une durée de vie fixe basée sur des attributs spécifiques définis par le fabricant. Il peut s'agir, par exemple, du nombre d'écritures et d'effacements, ainsi que du volume de données transférées aux lecteurs sur une période donnée. La durée de vie du SSD sur les noeuds Leaf et Spine peut s'épuiser en raison de l'usure régulière. Si l'utilisateur ne prend pas les mesures appropriées contre un commutateur dont le disque SSD est sur le point d'être épuisé, le commutateur peut tomber en panne en raison du passage du disque SSD en mode lecture seule. Pour cette raison, il est impératif de donner la priorité au remplacement du disque SSD dans le cas où la panne F3073 est soulevée contre un noeud donné. Les disques SSD sont remplaçables sur site par un ingénieur de terrain certifié Cisco.
F3073 a été implémenté dans les versions 2.1(4), 2.2(4), 2.3(1o) et 3.1(2m). Toutes les versions ultérieures du logiciel ont la fonctionnalité d'élever F3073.
Remarque : si vous exécutez une version du logiciel ACI qui ne dispose pas de la fonctionnalité de surveillance SSD, il est fortement conseillé de mettre à niveau vers une version où cette surveillance est disponible.
1. Lorsque le commutateur ne démarre pas, sur la console, vous pouvez voir ces erreurs :
/dev/hd-cfg0: ********** WARNING: Filesystem still has errors **********
e2fsck 1.42.1 (17-Feb-2012)
/dev/hd-cfg1: recovering journal
/sbin/e2fsck: unable to set superblock flags on /dev/hd-cfg1
2. Le système est en mesure de signaler de manière proactive les défaillances liées au SSD (F3073 ou F3074 en fonction de l'utilisation de la durée de vie du SSD) lors de versions de code ultérieures (traitées dans une section ultérieure).
F3074: fltEqptFlashFlash-minor-alarm (80% lifetime)
F3073: fltEqptFlashFlash-worn-out (90% lifetime)
3. Vous pouvez également voir une erreur F3525 déclenchée pour une utilisation SSD élevée. Ce défaut est souvent confondu avec F3073/F3074.
# fault.Inst
code : F3525
ack : no
annotation :
cause : equipment-flash-warning
changeSet : deltape (New: 21), peCycles (New: 1678), tbw (New: 32.465179), warning (New: yes)
childAction :
created : 2019-08-05T18:22:01.455-07:00
delegated : no
descr : High SSD usage observed. Please check switch activity and contact Cisco Technical Support about high SSD usage.
dn : topology/pod-1/node-206/sys/ch/supslot-1/sup/flash/fault-F3525
domain : infra
extMngdBy : undefined
highestSeverity : warning
lastTransition : 2019-08-05T18:24:02.029-07:00
lc : raised
modTs : never
occur : 1
origSeverity : warning
prevSeverity : warning
rn : fault-F3525
rule : eqpt-flash-flash-warning-alarm
severity : warning
status :
subject : flash-warning-alarm
type : operational
Le défaut F3525 est augmenté si les cycles P/E (effacement de programme) augmentent de plus de 21 en sept jours. Cela ne signifie pas que le SSD est usé, simplement qu'il y a beaucoup de barattage qui pourrait éventuellement causer l'usure des SSD.
Vous devez travailler avec le Centre d'assistance technique (TAC) pour comprendre ce qui cause ce problème et y remédier. Il existe également une politique pour modifier les seuils qui provoquent l'augmentation de F3525 pour un type spécifique de SSD (Voir Politiques d'accès > Politiques > Commutateur > Politiques de configuration Flash de l'équipement).
Il existe deux façons de vérifier l'état de la durée de vie des disques SSD :
La surveillance de la durée de vie des SSD a été ajoutée dans le cadre de l'ID de bogue Cisco CSCve8634 dans ces versions de code :
Une défaillance mineure se produit lorsque le disque approche 80 % de sa durée de vie et une défaillance majeure se produit lorsqu'il dépasse 90 % de sa durée de vie.
Cela permet aux opérateurs réseau de surveiller et de remplacer de manière proactive tout commutateur avant qu'il ne tombe en panne en raison d'un dépassement de la durée de vie SSD.
Les versions antérieures du code n'avaient pas de vérification de durée de vie SSD pour les SSD de commutateur. Par conséquent, même si le commutateur approchait de l'expiration du disque SSD, aucune défaillance ne se produirait.
La journalisation de l'utilisation des disques SSD a été introduite à partir de ces versions : 3.2(5d), 3.2(6i), 3.2(7f) et 4.1(1i).
a-leaf101# cat /mnt/pss/ssd_log_amp.log (Tested on 4.2.3l)
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Mon Dec 16 19:00:01 EST 2019 16531370 0 29398 12350 100 0 122396965772 3825894828 60841125365 16 0.00 % 0 0
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Tue Dec 17 19:00:01 EST 2019 16531725 0 29422 12355 100 0 122447755358 3827482016 60858831240 16 0.00 % 12355 61606629993
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Wed Dec 18 19:00:01 EST 2019 16532222 0 29446 12359 100 0 122495197374 3828964594 60875667807 16 0.00 % 12359 61636366134
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Thu Dec 19 19:00:01 EST 2019 16533056 0 29470 12364 100 0 122542269672 3830435617 60892533342 16 0.00 % 12364 61666601865
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Fri Dec 20 19:00:01 EST 2019 16534010 0 29494 12367 100 0 122587126224 3831837398 60908759296 16 0.00 % 12367 61694592882
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Sat Dec 21 19:00:01 EST 2019 16535311 0 29518 12372 100 0 122631804318 3833233605 60925205662 16 0.00 % 12372 61723045022
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Sun Dec 22 19:00:01 EST 2019 16536727 0 29542 12376 100 0 122676829388 3834640654 60941741722 16 0.00 % 12376 61751623726
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Mon Dec 23 19:00:01 EST 2019 16538321 0 29566 12380 100 0 122722137414 3836056544 60958504969 16 0.00 % 12380 61780395692
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Tue Dec 24 19:00:01 EST 2019 16539858 0 29591 12384 100 0 122767087802 3837461258 60975050343 16 0.00 % 12384 61808582833
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Wed Dec 25 19:00:01 EST 2019 16541121 0 29615 12388 100 0 122812238580 3838872234 60991578411 16 0.00 % 12388 61837188237
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Thu Dec 26 19:00:01 EST 2019 16542653 0 29639 12393 100 0 122857007868 3840271286 61008101155 16 0.00 % 12393 61865429457
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Fri Dec 27 19:00:01 EST 2019 16544352 0 29663 12397 100 0 122901807026 3841671272 61024757511 16 0.00 % 12397 61893705871
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Sat Dec 28 19:00:01 EST 2019 16546213 0 29687 12401 100 0 122946927200 3843081289 61041459287 16 0.00 % 12401 61922169689
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Sun Dec 29 19:00:01 EST 2019 16549522 0 29711 12405 100 0 122991584018 3844476827 61058889999 16 0.00 % 12405 61950124731
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Mon Dec 30 19:00:01 EST 2019 16551885 0 29735 12410 100 0 123036252528 3845872732 61075846564 16 0.00 % 12410 61977362529
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Tue Dec 31 19:00:01 EST 2019 16553858 0 29759 12414 100 0 123098133082 3847806568 61093085451 16 0.00 % 12414 62022286518
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Wed Jan 1 19:00:01 EST 2020 16555127 0 29783 12418 100 0 123142018610 3849178024 61109758713 16 0.00 % 12418 62048933159
Model SerialNo Software-Version Date RawReadError(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attribute(210) TBW(246) HostPageCount(247) BackgroundPageCount(248) WAF Delta_WAF Delta_PE Delta_TBW
Micron_M600_MTFDDAT064MBF MSA195207V1 Thu Jan 2 19:00:01 EST 2020 16556532 0 29808 12422 100 0 123186637556 3850572390 61126687626 16 0.00 % 12422 62076878843
Model SerialNo SW-Version Date R.Error(1) GBB(5) UpTime(9) PE(173) LifeTime(202) Attr(210) TBW(246) WAF DWAF DPE DTBW
Micron_M600_MTFDDAT064MBF MSA195207V1 14.2(3l) 2020-01-03 16557977 0 29832 12428 100 0 123278298184 16 0.00 % 0 0
Micron_M600_MTFDDAT064MBF MSA195207V1 14.2(3l) 2020-01-04 16558440 0 29856 12433 100 0 123323818606 16 0.00 % 5 45520422
Micron_M600_MTFDDAT064MBF MSA195207V1 14.2(3l) 2020-01-05 16559031 0 29880 12438 100 0 123369348610 16 0.00 % 5 45530004
Micron_M600_MTFDDAT064MBF MSA195207V1 14.2(3l) 2020-01-06 16561567 0 29904 12443 100 0 123415316270 16 0.00 % 5 45967660
Micron_M600_MTFDDAT064MBF MSA195207V1 14.2(3l) 2020-01-07 16564701 0 29928 12448 100 0 123460483898 16 0.00 % 5 45167628
Micron_M600_MTFDDAT064MBF MSA195207V1 14.2(3l) 2020-01-08 16565955 0 29952 12453 100 0 123505550532 16 0.00 % 5 45066634
le fichier ssd_log_amp.log se trouve dans la zone prise en charge par la technologie de commutation 1of3.
Pour toute commande supplémentaire liée au fabricant, les sorties nécessitent les privilèges d'un utilisateur racine, ce qui nécessite une demande de service TAC.
De nombreuses améliorations ont été apportées pour optimiser les écritures afin de maintenir la facilité de maintenance, tout en réduisant la quantité de données écrites sur le disque. Ces modifications ont été introduites dans différentes versions.
Les versions 3.2.4d et ultérieures et 4.x et ultérieures disposent de toutes les améliorations de surveillance des pannes et d'optimisation nécessaires pour prolonger la durée de vie des disques SSD. Cela ne signifie pas que la mise à niveau vers ces versions empêche absolument le problème de durée de vie SSD.
L'ID de bogue Cisco CSCvt36458 a modifié le comportement attendu d'un rechargement disgracieux de noeud de commutateur ACI :
Type de rechargement | Avant l'ID de bogue Cisco CSCvt36458 | Après le bogue Cisco ID CSCvt36458 (4.2(6d) et versions ultérieures et 5.1(1h) et versions ultérieures) |
Mises à niveau | Sans État | Sans État |
Rechargements en douceur (rechargements manuels, réinitialisations par hap) | Avec État | Avec État |
Rechargements intempestifs (panique du noyau, mise hors tension puis sous tension) | Avec État | Sans État |
En résumé, les rechargements de commutateurs en douceur continuent d'utiliser leur base de données lors de l'activation. Les rechargements intempestifs de commutateurs nécessitent désormais que toutes les politiques soient retirées du contrôleur APIC, comme une mise à niveau.
Le disque SSD peut-il être remplacé dans le champ ?
Oui. Cisco remplace désormais les disques SSD sur le terrain avec l'aide d'un ingénieur de terrain certifié. Sur les Spines modulaires, le superviseur entier est remplacé.
Devriez-vous remplacer de manière proactive le matériel du commutateur ?
Les ingénieurs du centre d'assistance technique peuvent vérifier les valeurs smartctl et évaluer quels commutateurs ont une durée de vie plus longue, afin que les commutateurs les plus urgents puissent être remplacés immédiatement, puis progressivement pour remplacer les commutateurs qui ne sont pas aussi urgents.
Existe-t-il des PID matériels spécifiques qui sont plus sensibles aux pannes de SSD ?
Non. La durée de vie des disques SSD peut varier d'un périphérique à l'autre dans le même environnement. L'utilisation des disques SSD dépend de la fréquence à laquelle le périphérique doit écrire les journaux pour la conservation des événements. Un périphérique qui enregistre un grand nombre d'événements provoqués par l'instabilité du réseau peut atteindre sa durée de vie SSD plus tôt que les autres. Cisco préconise donc d'utiliser des versions ultérieures pour s'assurer que l'optimisation du code contribue au contrôle des écritures SSD et prolonge la durée de vie des SSD.
Révision | Date de publication | Commentaires |
---|---|---|
3.0 |
18-Jan-2024 |
Mise à jour de la section FAQ Divers suite aux modifications récentes apportées au processus de remplacement des disques SSD. |
1.0 |
09-Jan-2020 |
Première publication |