Inleiding
Dit document beschrijft het proces om een offline knooppunt in Cisco HyperFlex-clusters te hergroeperen.
Voorwaarden
Vereisten
Dit wordt alleen ondersteund voor Hyperflex-clusters die vanaf Intersight en vanaf versie 5.0(2b) worden geïmplementeerd. Clusters die via Hyperflex-installateur worden geïmplementeerd en in Intersight worden geïmporteerd, worden voor deze functie nog niet ondersteund.
Soort scenario's die voor deze Intersight-functie worden ondersteund:
- FI/standaardcluster, stretch cluster, Edge-cluster en DC-No-FI-cluster
- Clusters met SED (zelfversleutelde stations)
- Clusters die alleen vanaf Intersight worden geïmplementeerd
- ESXi- en SCVM-herimplementatie
- Alleen herimplementatie van SCVM
Niet-ondersteunde scenario’s
- 1 GbE HyperFlex Edge en stretch clusters.
- Clusters geïmporteerd in Intersight
Licentie
Intersight Essentials of superieure licentie is vereist voor herimplementatie van HyperFlex-knooppunten. Alle servers in het HyperFlex-cluster moeten worden geclaimd en geconfigureerd met Intersight Essentials of superieure licentie.
Gebruikte componenten
- Cisco-onderschepping
- Cisco UCS M2000 (optioneel)
- Cisco UCS-servers
- Cisco HyperFlex Cluster versie 5.0(2c)
- ESXi van VMware
- VMware vCenter
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u zorgen dat u de potentiële impact van elke opdracht begrijpt.
Achtergrondinformatie
Het behoud van een cluster wordt om meerdere redenen een prioriteit, maar de belangrijkste is redundantie omwille van gegevensintegriteit in de Hypercoverge-opslagoplossing. Er zijn meerdere scenario's waarvoor ESXi en SCVM (Storage Controller Virtual Machine) gelijktijdig opnieuw moeten worden ingezet, zoals het vervangen van de opstartschijf in convergeknooppunten.
Voor clusters die vanaf Intersight worden geïmplementeerd, kunt u de SCVM opnieuw implementeren om deze weer toe te voegen aan het Hyperflex-cluster, deze activiteit kan nu worden uitgevoerd zonder TAC-ondersteuning via Intersight.
Waarschuwing: het is belangrijk om te benadrukken dat het niet succesvol uitvoeren van dit proces kan leiden tot clusters met meerdere onverwachte problemen, zoals toekomstige mislukkingen van clusterupgrades en mislukte clusteruitbreidingen.
Configuratie
In dit voorbeeld gebruiken we een 3 Node Edge-cluster met de naam Medellin, waardoor knooppunt 3 beschadigd is geraakt als gevolg van een M.2-schijffout
Vanaf Intersight gaat ons uitgangspunt uit van een aantal aspecten die al aan bod komen:
- M.2 Opslag is al vervangen
- Hyperflex-cluster is nog steeds ongezond omdat het die knooppunt offline heeft
Cluster Node-offlinevalidering
U kunt zien dat cluster ongezond is zoals uitgelegd en u moet de knooppunt herstellen die offline is nu de M.2 kwestie is opgelost
Ga van Intersight naar Infrastructuurservice > Hyperflex Cluster > Overzicht > Evenementen. U kunt de weerstandsstatus zien
Op hetzelfde tabblad Overzicht kunt u zien welke specifieke knooppunt ook offline is
Vanuit vCenter krijgen we ook een waarschuwing dat cluster ongezond is
Tot slot kunt u vanuit CLI ook de clusterstatus beoordelen:
hxshell:~$ hxcli cluster status
Cluster UUID : 6104001978967674717:7117835385033814973
Cluster Ready : Yes
Resiliency Health : WARNING
Operational Status : ONLINE
ZK Quorum Status : ONLINE
ZK Node Failures Tolerable : 0
hxshell:~$ hxcli cluster info
Cluster Name : Medellin
Cluster UUID : 6104001978967674717:7117835385033814973
Cluster State : ONLINE
Cluster Access Policy : Lenient
Space Status : NORMAL
Raw Capacity : 9.8 TiB
Total Capacity : 3.0 TiB
Used Capacity : 30.4 GiB
Free Capacity : 3.0 TiB
Compression Savings : 62.06%
Deduplication Savings : 0.00%
Total Savings : 62.06%
# of Nodes Configured : 3
# of Nodes Online : 2
Data IP Address : 169.254.218.1
Resiliency Health : WARNING
Policy Compliance : NON_COMPLIANT
Data Replication Factor : 3 Copies
# of node failures tolerable : 0
# of persistent device failures tolerable : 1
# of cache device failures tolerable : 1
Zone Type : Unknown
All Flash : No
Stappen opnieuw implementeren
Stap 1. Installeer het ESXi-besturingssysteem opnieuw. Hiervoor kunt u naar Servers gaan > Selecteer Server > Opties (drie punten) > Selecteer Start KVM.
Waarschuwing: u moet een aangepaste Cisco HyperFlex-afbeelding downloaden voor dezelfde exacte ESXi-versie als de andere knooppunten in het cluster worden uitgevoerd. U kunt het hier downloaden
Wanneer KVM is gestart, navigeren naar virtuele media >Selecteer Virtuele apparaten activeren
Selecteer vervolgens Bladeren >De Hyperflex ESXi-iso-afbeelding op uw lokale computer selecteren >Kies Map Drive
Navigeren naar Aan/uit >afhankelijk van de status van de server. Selecteer Aan/uit-systeem of Reset-systeem of Power Cycle-systeem
Tip: Reset System (warm boot) start het systeem opnieuw op zonder het uit te schakelen, terwijl Power Cycle System (koud boot)het systeem uitschakelt en weer aanzet. In dit scenario met een beschadigde SCVM en een herinstallatie van ESXi voldoen beide opties aan hetzelfde doel
U moet opstarten vanaf het virtuele apparaat op CD/DVD. Navigeren naar Gereedschappen >Toetsenbord selecteren > Wanneer u de melding Opstartmenu ziet, drukt u op F6
U gaat naar het opstartmenu en nadat u Cisco vKVM-Mapped vDVD1.24 hebt geselecteerd, drukt u op ENTER
Selecteer Ik heb het bovenstaande bericht gelezen en ik wil doorgaan en op ENTER klikken
Regelmatig ziet u verschillende opties voor compute knooppunten afhankelijk van welk specifiek bootapparaat wordt gebruikt en een andere optie voor converge knooppunten die u hier moet selecteren
Daarna wordt u gevraagd om gebruikersnaam en wachtwoord in te voeren. Typ gebruikersnaam wissen > hit Enter > Type wachtwoord wissen > hit Voer in
Opmerking: als er een verkeerd wachtwoord/gebruikersnaam wordt ingevoerd, wordt u één stap teruggezet en kunt u het nogmaals proberen
De installatie begint op dit punt en u kunt deze via vKVM bewaken
Stap 2. Navigeren naar Infrastructuurservice > HyperFlex Clusters >Selecteer uw HyperFlex-cluster >Acties > Selecteer Opnieuw implementatieknooppunt
Tip: als alleen SCVM beschadigd is en opnieuw geïnstalleerd moet worden, moet u de server uitschakelen voordat u Opnieuw implementeren selecteert als u niet in de fout komt "Opnieuw implementeren knooppunt kan niet worden geactiveerd omdat er geen offline hosts in dit cluster zijn."
Stap 3. Selecteer het knooppunt offline >Selecteer Doorgaan
Stap 4. Controleer of het beleid voor security, vCenter en Proxy-instellingen overeenkomt met hetzelfde cluster en selecteer Volgende
Als echter alleen SCVM wordt geherimplementeerd en ESXi intact is, moet u vanuit het Beveiligingsbeleid de optie "De hypervisor op deze knooppunt gebruikt de standaard fabriekswachtwoord" uitschakelen en ervoor zorgen dat het huidige ESXi-wachtwoord daar wordt geüpdatet voordat u Volgende selecteert
Stap 5. Selecteer Valideren en opnieuw implementeren
Stap 6. Wacht tot de workflow is voltooid
Opmerking: U kunt de voortgang controleren, maar dit duurt meestal een paar uur
Ten slotte hergroeperen voltooid en Medellin cluster is terug naar gezonde status
Validering van de gezonde status van het cluster
Validatie van intersight
Navigeren naar HyperFlex Clusters > Cluster selecteren > tabblad Overzicht selecteren
Validatie van HyperFlex Connect
Lunch HXDP van Intersight om de status vanaf daar te valideren
Validatie van CLI
Vanaf CLI kunt u opdrachten gebruiken zoals: hxcli cluster status, hxcli cluster info, hxcli cluster gezondheid, hxcli knooppunt lijst
hxshell:~$ hxcli cluster status
Cluster UUID : 6104001978967674717:7117835385033814973
Cluster Ready : Yes
Resiliency Health : HEALTHY
Operational Status : ONLINE
ZK Quorum Status : ONLINE
ZK Node Failures Tolerable : 1
hxshell:~$ hxcli cluster info
Cluster Name : Medellin
Cluster UUID : 6104001978967674717:7117835385033814973
Cluster State : ONLINE
Cluster Access Policy : Lenient
Space Status : NORMAL
Raw Capacity : 9.8 TiB
Total Capacity : 3.0 TiB
Used Capacity : 31.7 GiB
Free Capacity : 3.0 TiB
Compression Savings : 80.90%
Deduplication Savings : 0.00%
Total Savings : 80.90%
# of Nodes Configured : 3
# of Nodes Online : 3
Data IP Address : 169.254.218.1
Resiliency Health : HEALTHY
Policy Compliance : COMPLIANT
Data Replication Factor : 3 Copies
# of node failures tolerable : 1
# of persistent device failures tolerable : 2
# of cache device failures tolerable : 2
Zone Type : Unknown
All Flash : No
Gerelateerde informatie
HyperFlex Node Replacement Workflow