El conjunto de documentos para este producto aspira al uso de un lenguaje no discriminatorio. A los fines de esta documentación, "no discriminatorio" se refiere al lenguaje que no implica discriminación por motivos de edad, discapacidad, género, identidad de raza, identidad étnica, orientación sexual, nivel socioeconómico e interseccionalidad. Puede haber excepciones en la documentación debido al lenguaje que se encuentra ya en las interfaces de usuario del software del producto, el lenguaje utilizado en función de la documentación de la RFP o el lenguaje utilizado por un producto de terceros al que se hace referencia. Obtenga más información sobre cómo Cisco utiliza el lenguaje inclusivo.
Cisco ha traducido este documento combinando la traducción automática y los recursos humanos a fin de ofrecer a nuestros usuarios en todo el mundo contenido en su propio idioma. Tenga en cuenta que incluso la mejor traducción automática podría no ser tan precisa como la proporcionada por un traductor profesional. Cisco Systems, Inc. no asume ninguna responsabilidad por la precisión de estas traducciones y recomienda remitirse siempre al documento original escrito en inglés (insertar vínculo URL).
Este documento describe las prácticas recomendadas para ejecutar correctamente el proceso de actualización del clúster de HyperFlex.
s
Cisco recomienda conocer estos temas:
La información que contiene este documento se creó a partir de los dispositivos en un ambiente de laboratorio específico. Todos los dispositivos que se utilizan en este documento se pusieron en funcionamiento con una configuración verificada (predeterminada). Si tiene una red en vivo, asegúrese de entender el posible impacto de cualquier comando.
La decisión sobre la versión de destino seleccionada se basa en las necesidades del entorno HyperFlex. Su propósito es mejorar, reparar y aprovechar el nuevo software del anterior.
Lea las notas de la versión de HyperFlex para identificar información como las nuevas funciones, el nuevo hardware compatible, la interoperabilidad entre componentes, las directrices, las limitaciones, las correcciones de seguridad y las advertencias resueltas.
Para comprobar la información de las notas de la versión, haga clic aquí.
Antes de ejecutar la actualización del clúster de Hyperflex, confirme que todas las versiones son compatibles. Cisco recomienda:
Consulte las guías de actualización de Cisco HyperFlex que proporcionan instrucciones paso a paso para llevar a cabo.
Las guías proporcionan información sobre diferentes tipos de escenarios, como:
Realice comprobaciones de estado antes de ejecutar la actualización de HyperFlex para corregir posibles errores y evitar comportamientos inesperados durante la actualización.
Existen dos métodos diferentes para realizar estas comprobaciones de estado.
Esta herramienta es una utilidad para realizar autocomprobaciones proactivas en sistemas HyperFlex para garantizar su estabilidad y resistencia.
La información de la guía de hipercomprobación se encuentra aquí.
Este es el método sugerido para las comprobaciones previas. Se actualiza periódicamente para incluir nuevas funciones de solución de problemas que detectan fácilmente posibles errores de configuración.
Se mantiene al día encontrando advertencias recién descubiertas que representan inconvenientes durante el proceso de actualización. La información de la guía Intersight HealthCheck se puede encontrar aquí.
Paso 1. Inicie sesión en Intersight y navegue hasta Infrastructure Service, luego seleccione HyperFlex Clusters y elija el Cluster.
Los ejemplos muestran un clúster denominado San_Jose. En el menú desplegable Acciones, seleccione Ejecutar comprobación de estado.
Nota: Este ejemplo muestra las comprobaciones de estado realizadas en un solo cluster. Puede seleccionar y realizar comprobaciones de estado en varios clústeres al mismo tiempo.
Confirme el clúster y haga clic en Next.
El flujo de trabajo le permite omitir algunas comprobaciones, si lo desea.
Paso 2. Haga clic en Start para iniciar la comprobación previa.
Compruebe la barra de progreso y espere a que se complete la tarea HealthCheck.
Paso 3. Una vez completada la tarea HealthCheck, hay un par de lugares en los que se pueden comprobar los resultados.
La pestaña Comprobación de estado muestra los resultados generales. El ejemplo se filtra para que no se muestren los resultados Passed y Not Run.
Paso 4. Haga clic en Nodos afectados para verificar los nodos en cuestión.
En la pestaña Descripción general, consulte Eventos: Alarmas, Solicitudes, y Avisos.
Amplíe cada evento para obtener más detalles.
El ejemplo muestra Solicitudes expandidas, haga clic en Error en la ejecución de comprobaciones de estado de hipercomprobación seleccionadas.
Muestra todas las comprobaciones correctas e incorrectas.
Paso 5. Haga clic en la opción Mostrar detalles adicionales.
Cada Invoke Check se puede expandir, proporcionando una vista granular de lo que se ha comprobado.
Proporciona información detallada en formato JSON para los registros, entradas y salidas.
Compruebe el vídeo.
Vídeo de comprobación de estado de Intersight.
Nota: algunas correcciones requieren la intervención del Technical Assistance Center (TAC). Abra un caso si es necesario.
El administrador de firmware de UCS Manager requiere la descarga de los paquetes de firmware de UCS en la partición de inicio flash de Fabric Interconnect. Verifique y elimine los paquetes de firmware antiguos que ya no se utilizan en los componentes para evitar llenar la partición de inicio flash de Fabric Interconnects con archivos innecesarios.
Verifique el espacio de Fabric Interconnect.
Paso 1. Vaya a Equipo, seleccione Fabric Interconnects y elija un Fabric Interconnect. El ejemplo muestra Fabric interconnect A (principal).
Paso 2. En el panel general, seleccione Información de almacenamiento local y expándala.
Si el switch ascendente admite el comando STP PortFast, se recomienda encarecidamente habilitarlo. La habilitación de la función PortFast hace que un switch, o un puerto trunk, ingrese al estado de reenvío STP inmediatamente, o en un evento de link, evitando así los estados de escucha y de aprendizaje.
La función PortFast se habilita a nivel de puerto, y este puerto puede ser un puerto físico o lógico.
Verifique en UCSM cualquier fallo relacionado con errores de puerto en los enlaces ascendentes o los puertos del servidor para evitar situaciones de conmutación por error no deseadas.
Paso 1. Inicie sesión en UCSM y navegue hasta la pestaña Equipment, expanda Rack-Mounts y expanda Servers. El ejemplo muestra Servidor 1.
Paso 2. Expanda Adapters y luego expanda NICs.
Paso 3. Compruebe que cada tarjeta de interfaz de red (NIC) está limpia.
La VLAN de datos de almacenamiento debe configurarse en el dispositivo ascendente para garantizar que se realice la conmutación por fallo en caso de que la fabric interconectada B esté inactiva.
Asegúrese de que tiene todos los requisitos enumerados en la guía de instalación de HyperFlex.
Asegúrese de que la conectividad de red fluya para ambas rutas en las tarjetas de interfaz de red de máquina virtual (vmnics).
Nota: Para realizar la prueba de conectividad ascendente, compruebe este vídeo.
Confirme que el agrupamiento de NIC correcto está configurado correctamente en función de las políticas de UCS con esta guía.
Durante una actualización de la infraestructura, espere a que aparezcan los enlaces ascendentes de ESXi antes de reiniciar el otro Fabric Interconnect.
A partir de Cisco HyperFlex Release 4.0(2a), la página de actualización muestra el último resultado de la prueba de idoneidad para la actualización del clúster y la última versión probada del servidor UCS, la plataforma de datos HX o ESXi.
Para realizar la prueba de idoneidad de la actualización, inicie sesión en HX Connect:
Paso 1. Seleccione Upgrade > Test Upgrade Eligibility.
Paso 2. Seleccione la casilla de verificación UCS Server Firmware para probar la idoneidad de actualización del firmware del servidor UCS.
Paso 3. Introduzca el nombre de dominio completo (FQDN) o la dirección IP, el nombre de usuario y la contraseña de Cisco UCS Manager. En el campo Current Version, haga clic en Discover para elegir la versión del paquete de firmware de UCS que debe validarse antes de la actualización.
Paso 4. Seleccione la casilla de verificación HX Data Platform para probar la idoneidad de la actualización de la plataforma de datos HyperFlex.
Paso 5. Introduzca el nombre de usuario y la contraseña del vCenter. Cargue el paquete de actualización de la plataforma de datos Cisco HyperFlex que debe validarse antes de la actualización.
Paso 6. Seleccione la casilla de verificación ESXi para probar la idoneidad de la actualización de ESXi.
Paso 7. Introduzca el nombre de usuario y la contraseña del administrador del vCenter. Cargue el paquete de imagen sin conexión personalizada de Cisco HyperFlex que debe validarse antes de la actualización
Paso 8. Pulse Validar.
Paso 9. Se muestra el progreso de la prueba de elegibilidad de actualización.
Verificar contraseñas para:
Asegúrese de que las máquinas virtuales que se ejecutan en el host se puedan migrar a otro host durante la operación de modo de mantenimiento. Si no se puede migrar una VM, es necesario apagarla. Si una máquina virtual no migra automáticamente, pero puede hacerlo manualmente, compruebe si hay algún problema relacionado con DRS.
Verifique que DRS esté habilitado y configurado como totalmente automatizado, si tiene licencia para DRS. Si DRS está desactivado, se requiere la intervención manual para mover las VM manualmente cuando el proceso de actualización lo solicite.
Consulte la guía de VMware para obtener más información.
Confirmar vMotion está configurado correctamente para evitar tareas de modo de mantenimiento que no se pueden completar.
Para obtener más información sobre la resolución de problemas de vMotion, consulte aquí.
Paso 1. Inicie sesión en VMware vCenter y navegue hasta Inicio y clústeres.
Paso 2. Haga clic en el clúster de vCenter. Este ejemplo muestra un clúster denominado San_Jose.
Paso 3. Seleccione Configure, en Configuration, haga clic en VMware EVC y seleccione EDIT.
Paso 4. Asegúrese de cambiar el modo EVC a Enabled para el procesador respectivo utilizado.
Verifique si existe alguna regla de afinidad creada en la VM de invitado.
Paso 1. Vaya al clúster desde VMware vCenter.
Paso 2. Vaya a Inicio y Clústeres. Este ejemplo muestra un clúster denominado San_Jose.
Paso 3. Seleccione Configurar. En Configuration, seleccione VM/Host Rules y verifique que se haya creado cualquier regla.
A partir de HXDP 5.0(x) y versiones posteriores, EAM ya no se utiliza en los hosts de ESXi para administrar la red y el almacén de datos de SCVM.
A partir de HXDP 5.0(x) y versiones anteriores, la red y el almacén de datos necesitan tener información SCVM.
Para verificar que el estado del ESXi Agent Manager (EAM) es normal.
Paso 1. Inicie sesión en VMware vCenter.
Paso 2. Vaya a Inicio y clústeres y vaya a cada nodo de ESXi.
Paso 3. En el clúster de VMware vCenter, vaya a Configure y, en Virtual Machines, seleccione Agent VM Settings.
El ejemplo muestra espacios en blanco ya que el clúster de HyperFlex de ejemplo está en 5.0(2c)
Si se utiliza EAM, confirme que no se muestre ningún error de certificado en vCenter.
Puede encontrar más información sobre EAM aquí
Licencias de vCenter y ESXi
Si va a actualizar de 6.x a 7.0, asegúrese de que dispone de las nuevas licencias antes de la actualización.
Tras la actualización, solo dispondrá de 60 días en el modo de evaluación.
Los intentos fallidos de iniciar sesión pueden provocar el bloqueo de los usuarios de ESXi.
Para comprobar el estado del usuario hxuser o root
Paso 1. Abra una sesión SSH como raíz en el nodo ESXi.
Paso 2. Ejecute pam_tally2 —user hxuser (o usuario raíz).
Paso 3. Asegúrese de que se ha bloqueado el usuario hxuser o la raíz.
[root@esxi1:~] pam_tally2 --user hxuser
Login Failures Latest failure From
hxuser 0
[root@esxi1:~] pam_tally2 --user root
Login Failures Latest failure From
root 0
[root@esxi1:~]
Para desbloquear los usuarios de ESXi mencionados:
Paso 1. Ejecute pam_tally2 —user hxuser —reset (o usuario root).
Paso 2. Asegúrese de que el recuento de fallos disminuya a 0.
[root@esxi1:~] pam_tally2 --user hxuser --reset
Login Failures Latest failure From
hxuser 0
[root@esxi1:~] pam_tally2 --user root --reset
Login Failures Latest failure From
root 0
Para aumentar la seguridad en el host de ESXi es necesario activar el modo de bloqueo. Esta configuración impide las actualizaciones de HyperFlex debido al modo de bloqueo que debe deshabilitarse para una actualización de clúster de HyperFlex.
Para desactivar el modo de bloqueo de ESXi:
Paso 1. Ejecute SSH directamente en el host de ESXi como raíz.
Paso 2. Pulse F2paraConfiguración inicial.
Paso 3. Introduzca las credenciales raíz para abrir la configuración de DUCI.
Paso 4. Vaya a la opción Configure Lockdown Modesetting y cámbiela a disabled.
Para desactivar el modo de bloqueo desde vCenter,
Paso 1. Busque el host en el inventario de vSphere Web Client.
Paso 2. Haga clic en la ficha Administrar y haga clic en Configuración. (con la versión 6.7, haga clic en la fichaConfigurar).
Paso 3. En Sistema, seleccione Perfil de seguridad.
Paso 4. En el panel Modo de bloqueo, haga clic en Editar.
Paso 5. Haga clic en Modo de bloqueo y seleccione una de las opciones de modo de bloqueo.
Puede encontrar más información sobre el modo de bloqueo aquí
Si la replicación está configurada y habilitada, debe pausarse antes de la actualización.
Haga una pausa en la replicación mediante el comando run stcli dp schedule pause y habilítela después de la actualización mediante el comando stcli dp schedule resume.
Los errores de unidad provocan errores en la actualización del clúster de HyperFlex. Para verificar la GUI de HyperFlex Connect en busca de discos bloqueados u omitidos:
Paso 1. Abra la GUI de conexión de HyperFlex y vaya a https://<HyperFlex-virtual-ip-address o fqdn>.
Paso 2. Vaya a Información del sistema y seleccione Descripción del sistema.
Paso 3. Compruebe si hay errores de disco.
El TAC de Cisco debe solucionar los problemas de disco.
La sustitución de la placa base hace que también se reemplacen los UID de host anteriores por los nuevos ID. Si se han producido algunos problemas durante las tareas de sustitución, la falta de coincidencia de los UID podría provocar un error en la actualización de HyperFlex.
Nota: Intersight HealthCheck aconseja sobre la discordancia de ID. Se recomienda encarecidamente tener el clúster de HyperFlex conectado a Intersight y ejecutar HyperFlex Cluster HealthCheck.
Para la sustitución de la placa base, compare el UUID de stNode de la CLI de ESXi para asegurarse de que la información del UUID coincide con el UUID del clúster de Hyperflex.
Para recopilar el UID:
Paso 1. Abra una sesión SSH en el nodo ESXi como raíz.
Paso 2. Ejecute este comando: hostsvc/hostsumm | grep -i uuid | grep -v inst.
Paso 3. Recopile la información del UUID.
[root@esxi2:~] vim-cmd hostsvc/hostsumm | grep -i uuid | grep -v inst
uuid = "1f82077d-6702-214d-8814-e776ffc0f53c", <----- ESXi2 ID
[root@esxi2:~]
[root@esxi2:~]
Para obtener la información de UUID en el nodo de clúster de HyperFlex:
Paso 1. Ejecute SSH en la dirección IP del clúster de HyperFlex.
Paso 2. Ejecute el comando stcli cluster info | más.
Paso 3. Recopile los ID de stNodes.
hxshell:~$ stcli cluster info | more
stNodes:
----------------------------------------
id: c4a24480-e935-6942-93ee-987dc8e9b5d9
type: node
name: esxi1
----------------------------------------
id: 1f82077d-6702-214d-8814-e776ffc0f53c <----- ID for ESXi2
type: node
name: esxi2
----------------------------------------
id: 50a5dc5d-c419-9c48-8914-d91a98d43fe7
type: node
name: esxi3
----------------------------------------
Asegúrese de que los ID de información del clúster stcli coincidan con la información que se muestra en los nodos ESXi.
Verifique que la información de vCenter, como los nombres de Data Center, clúster y almacén de datos del clúster de HyperFlex, coincida con vCenter. La falta de coincidencia de la información provoca un error en la actualización del clúster de HyperFlex.
Para obtener la información más reciente:
Paso 1. Ejecute SSH en la IP del clúster de HyperFlex como admin.
Paso 2. Ejecute stcli cluster info | grep -i vcenter.
Paso 3. Recopile la información del vCenter registrado en el clúster.
hxshell:~$ stcli cluster info | grep -i vcenter
vCenterClusterName: vcenter-cluster
vCenterDatacenter: hx-cluster-name
vCenterURL: https://vcenter-url
vCenterDatacenterId: datacenter-name
vCenterClusterId: domain-c5124
vCenterUrl: https://vcenter-url
vCenterVersion: 7.0.2 Build-18455184
Tenga en cuenta que los nombres distinguen entre mayúsculas y minúsculas. Si el nombre y la información del vCenter de la salida anterior no coinciden, es necesario volver a registrar el vCenter.
Para volver a registrar el vCenter en el clúster de Hyperflex, vea el vídeo de registro del vCenter aquí
Para volver a registrar el Vcenter:
Paso 1. Ejecute SSH en la dirección IP del clúster como administrador.
Paso 2. Ejecute el comando stcli cluster reregister.
stcli cluster reregister [-h] --vcenter-datacenter NEWDATACENTER --vcenter-cluster NEWVCENTERCLUSTER --vcenter-url NEWVCENTERURLIP [--vcenter-sso-url NEWVCENTERSSOURL] --vcenter-user NEWVCENTERUSER
hxshell:~$ stcli cluster reregister --vcenter-datacenter MyData-Center --vcenter-cluster Cluster-Name --vcenter-url https://vcenter1-url --vcenter-user <vCenter user>
Reregister StorFS cluster with a new vCenter ...
Enter NEW vCenter Administrator password:
Cluster reregistration with new vCenter succeeded
hxshell:~$
Revisión | Fecha de publicación | Comentarios |
---|---|---|
2.0 |
30-Sep-2023 |
error tipográfico corregido |
1.0 |
10-Aug-2023 |
Versión inicial |