El conjunto de documentos para este producto aspira al uso de un lenguaje no discriminatorio. A los fines de esta documentación, "no discriminatorio" se refiere al lenguaje que no implica discriminación por motivos de edad, discapacidad, género, identidad de raza, identidad étnica, orientación sexual, nivel socioeconómico e interseccionalidad. Puede haber excepciones en la documentación debido al lenguaje que se encuentra ya en las interfaces de usuario del software del producto, el lenguaje utilizado en función de la documentación de la RFP o el lenguaje utilizado por un producto de terceros al que se hace referencia. Obtenga más información sobre cómo Cisco utiliza el lenguaje inclusivo.
Cisco ha traducido este documento combinando la traducción automática y los recursos humanos a fin de ofrecer a nuestros usuarios en todo el mundo contenido en su propio idioma. Tenga en cuenta que incluso la mejor traducción automática podría no ser tan precisa como la proporcionada por un traductor profesional. Cisco Systems, Inc. no asume ninguna responsabilidad por la precisión de estas traducciones y recomienda remitirse siempre al documento original escrito en inglés (insertar vínculo URL).
Este documento describe cómo funciona la automatización de bucle cerrado en redes definidas por software basadas en la nube en un escenario de implementación 5G.
La nube está revolucionando el funcionamiento de la tecnología en el mundo tradicional. Con la llegada del 5G, el paradigma ha cambiado en los entornos de los proveedores de servicios. La mayoría de las formas manuales y heredadas de operar una red están dando paso a una automatización completa, que proporciona una ventaja proactiva a las redes, llevándolas a una ruta de autorreparación. El documento proporciona una construcción de automatización de bucle cerrado basada en SDN que combina diferentes productos del ecosistema de Cisco con el fin de proporcionar un análisis, una visualización y una remediación en tiempo real, todo ello con las propias soluciones implementadas en la nube.
El 5G no solo está transformando la tecnología móvil, sino que también está creando enormes oportunidades para numerosos sectores y preparando el terreno para las interrupciones a gran escala.
El 5G está mejorando drásticamente el trabajo diario y la experiencia con una velocidad más rápida, un mayor ancho de banda y una latencia ultra baja.
No solo en el mundo móvil, el 5G va más allá de la comunicación móvil para abordar todas las formas de servicios de comunicación; de hecho, realmente está apoyando el futuro del mundo digital al permitir todo tipo de servicios, promover el cambio económico en todos los sectores y utilizar diversas tecnologías (WIFI, 4G y tecnologías de radio).
El documento no se centra en las fases de implementación. El enfoque es la automatización 5G y la arquitectura de orquestación en términos de funcionalidad y observabilidad de extremo a extremo.
En esta fase, el 5G se encuentra principalmente en la fase inicial de prueba e implementación, pero es necesario comprender los retos asociados. El número de elementos de red necesarios para ejecutar una red 5G en todos los dominios es enorme. La implementación de la mayoría de las redes 5G requiere automatización para garantizar una implementación rentable y eficiente con un funcionamiento perfecto de todos los componentes involucrados.
En un escenario de implementación automatizada, se puede eliminar la mayor parte del trabajo manual de planificación previa.
Los sistemas de inteligencia artificial (IA), basados en el aprendizaje automatizado (ML), pueden modelar cómo se desempeñan las funciones de red en condiciones normales y de carga elevada.
Mediante el uso de datos de rendimiento en tiempo de ejecución, el sistema puede garantizar la implementación automática de nuevos elementos según sea necesario. Para la optimización continua y la garantía del servicio, el sistema puede recopilar y analizar las fuentes de equipos de todos los tipos y examinar su rendimiento, determinando si coinciden con los parámetros que requieren y esperan los proveedores de servicios.
Existen tres componentes fundamentales para lograr una automatización satisfactoria.
Lo fundamental es tener seguridad y, a continuación, el aprendizaje automatizado, que puede predecir lo que la red está intentando conseguir y que conduce a la base de la automatización en bucle cerrado.
La solución propuesta es una solución de software que ofrece capacidades de automatización y garantía líderes en el sector que incluyen:
Aunque Vitria también puede gestionar el rendimiento para la mejor solución, tanto Matrix como Vitria forman parte de la solución propuesta, donde Matrix es la mejor para la gestión del rendimiento como herramienta y Vitria es la mejor para su capacidad de gestión de fallos.
Matrix es un marco de análisis genérico desarrollado por Cisco que permite una fácil adaptación a diferentes tipos de fuentes de datos y permite funciones de análisis de aplicaciones integradas en la solución. Matrix cuenta con estas funciones clave que le permiten crear o personalizar los casos prácticos según los requisitos.
Debido a la compleja red de sistemas interconectados compuesta por infraestructuras virtuales y físicas, redes internas y públicas, y aplicaciones interdependientes, la gestión de fallos es un reto constante.
La gestión de fallos tradicional se basa en herramientas de supervisión en silos que se dirigen a una capa independiente dentro de la pila tecnológica. Cada sistema de monitoreo genera volúmenes de alarmas. Los ingenieros de confiabilidad del servicio (SRE) revisan las alarmas y determinan si se debe abrir un ticket.
Los problemas interrelacionados entre los sistemas hacen que se abran varias notificaciones y que los equipos independientes realicen acciones que podrían no abordar la verdadera causa principal, lo que supone una pérdida de tiempo y recursos. Cuando finalmente se determina que los problemas aparentemente independientes pueden estar relacionados, se forma un equipo de funciones cruzadas para determinar la verdadera causa raíz y comprometer al agente de corrección o tarea apropiada para resolver el problema. Mientras se desarrolla este proceso tradicional de gestión de fallos, aumenta la frustración del cliente. Este proceso lento y laborioso ya no es eficaz. Es excesivamente lento y costoso.
Para reducir el tiempo de detección de problemas, acelerar la resolución y reducir los costes, las señales en el entorno operativo desde los elementos de TI hasta la red y la aplicación se deben ingerir, correlacionar y analizar. Una gestión eficaz de fallos requiere la reducción del ruido en las capas de servicio, la automatización para reducir el nivel de intervención humana y la integración con los procesos y sistemas de gestión existentes.
Un nuevo giro en el mundo de las redes fue la llegada del routing de segmentos, que simplificó las operaciones sustituyendo a las formas tradicionales como el switching de etiquetas multiprotocolo (MPLS). El routing por segmentos ha reducido la complejidad de las operaciones al eliminar una serie de protocolos y ha dado lugar a una reducción significativa de los gastos operativos generales.
La nueva línea de soluciones de Cisco, denominada CNC, es un controlador de SDN para redes de routing de segmentos. Una vez que una red está habilitada para SR, el CNC se hace una idea de lo que es un conjunto de soluciones que ayudan a visualizar la red, implementar servicios y políticas, y una serie de otras funcionalidades.
Cisco CNC permite a los clientes simplificar y automatizar el aprovisionamiento, la supervisión y la optimización de servicios de red por intención en un entorno de red de varios proveedores con una GUI y API comunes.
La solución combina la automatización de la red basada en objetivos con el fin de ofrecer capacidades críticas para la orquestación y prestación de servicios, incluida la optimización de la red, el cálculo de la ruta de servicio, la implementación y gestión de dispositivos, y la detección de anomalías con una remediación automática.
La solución totalmente integrada combina las funciones principales de varios productos innovadores líderes del sector, entre los que se incluyen Cisco Network Services Orchestrator (NSO), Cisco Segment Routing Path Computation Element (SR-PCE), Cisco Crosswork Data Gateway (CDG) e infraestructura de Cisco Crosswork y un conjunto de aplicaciones. Su interfaz de usuario unificada permite la visualización en tiempo real de la topología de red y los servicios, así como el aprovisionamiento de servicios y transporte, a través de un único panel de acceso.
Los principios de Crosswork se pueden resumir en tres principios de automatización:
CNC con su potente conjunto de soluciones proporciona un mecanismo integral para el control general de la red. Las soluciones varían en función del espectro y proporcionan una amplia gama de capacidades que satisfacen los tres principios mencionados anteriormente.
1. Topología activa
Las redes tradicionales no tenían componentes que proporcionaran una visualización de las redes una vez implementadas. Los operadores tenían que iniciar sesión físicamente en los routers para comprobar varias cosas. Con la topología activa de la interconexión, los operadores obtienen una visualización en tiempo real y en directo de toda la red, junto con los enlaces, la utilización, las tasas de tráfico, el estado de los nodos y los enlaces, el estado de las políticas de routing de segmentos (SR) y RSVP, así como la visualización de la ruta. Todo lo que el operador debe hacer ahora es iniciar sesión en una GUI intuitiva y tener la red a mano.
2. Motor de optimización entre redes (COE)
Una solución para proporcionar una optimización en tiempo real de la red que ayuda a los operadores a gestionar el uso de su red de forma eficiente. El objetivo final de COE es permitir redes de reparación automática sin necesidad de mucha intervención manual.
3. Crosswork Data Gateway (CDG)
Imagínese tener enormes redes con miles de dispositivos que generan una tonelada de datos. Dado que los datos son el nuevo petróleo, el CDG proporciona un mecanismo para recopilar todos estos datos de dispositivos que Crosswork puede aprovechar o incluso enviar a muchas otras aplicaciones de terceros para su análisis y otras transformaciones. CDG admite la recopilación de datos a través de varios protocolos, como SNMP, CLI, gRPC Network Management Interface (GNMI), MDT, syslog, etc.
4. Crosswork Health Insights (HI)
Con la red en funcionamiento, el modo tradicional consistía en realizar acciones de forma reactiva una vez que había transcurrido un evento de red concreto. A menudo, esto supone un gran coste para los clientes. HI permite el rendimiento automático de la supervisión en directo de KPI, la generación de alertas y la resolución de problemas. El usuario puede definir su propia lógica y, a continuación, HI genera alertas basadas en su supervisión. Esto permite una perspectiva automatizada del estado de la red.
5. Automatización del cambio de Crosswork
Las operaciones manuales rutinarias, como la aplicación de cambios de configuración, la instalación de nuevas versiones de software, actualizaciones y otras, se pueden automatizar y acelerar con el uso de la automatización de cambios. Esto hace uso de las campañas de Ansible integradas en y los cambios de configuración se introducen en los dispositivos aprovechando Cisco NSO.
6. Aprovisionamiento cruzado sin intervención (ZTP)
Los clientes son siempre partidarios de reducir los plazos de implementación y funcionamiento. Cuando tiene decenas o miles de nuevos dispositivos que se van a implementar en la red, en lugar del proceso manual habitual que podría estar plagado de errores y llevar mucho tiempo, Crosswork ZTP impulsa todo el proceso con una solución completamente automatizada para el aprovisionamiento e incorporación de nuevos dispositivos Cisco IOS® XR. Los dispositivos pueden configurarse en un día cero y añadirse rápidamente al inventario de dispositivos CNC, tras lo cual resulta más fácil supervisar y gestionar estos dispositivos.
Hay algunos otros montones de productos que trabajan en conjunto con el CNC con el fin de lograr los objetivos. El principal de ellos es Segment Routing Path Computation Element (SR-PCE), que es un Cisco IOS XR PCE que admite tanto SR como RSVP. De hecho, es el SR-PCE el que facilita la recolección de topologías a través del protocolo BGP-LS y calcula la trayectoria para permitir que el CNC funcione como un controlador.
El CNC también puede interactuar con el NSO, que ayuda a traducir una intención de red en configuraciones específicas para un dispositivo. El CNC, cuando se utiliza junto con el NSO, se convierte en un multiplicador de fuerza.
La supervisión Kafka se habilita con la ayuda de la herramienta Burrow. Burrow es un complemento de supervisión de Apache Kafka que proporciona comprobación de retraso del consumidor como servicio sin necesidad de especificar umbrales.
Supervisa las compensaciones comprometidas para todos los consumidores y calcula la situación de esos consumidores a demanda. Se proporciona un punto final HTTP para solicitar el estado a demanda, así como para proporcionar otra información de clúster de Kafka. Estas API se sondean mediante la herramienta Performance Monitoring (PM) para generar la supervisión de la demora del consumidor y proporcionar información de clúster de Kafka.
El uso de la CPU, el uso del almacenamiento y el uso de la memoria de los nodos Kafka también están disponibles en Matrix, que envía alarmas si se cruzan los umbrales o se detectan anomalías.
Este es el proceso de activación automatizada de nuevos dispositivos, generación de configuraciones y aprovisionamiento de red.
El marco de automatización de pruebas avanzado (TAF) proporciona una forma de ejecutar conjuntos de pruebas de forma paralela en miles de dispositivos al mismo tiempo, lo que elimina la necesidad de validación manual. Una enorme implementación de una red nunca puede ampliarse con solo la validación manual, y un marco automatizado como este ayuda a validar las configuraciones de los dispositivos y otras comprobaciones de la forma más eficaz y con plazos definidos.
Un operador puede iniciar cientos de pruebas en miles de dispositivos con solo hacer clic en un botón. El conjunto de pruebas realiza todas las pruebas configuradas, valida los datos y, a continuación, muestra todos los resultados con los criterios PASS/FAIL en un informe detallado basado en Web. Según el informe, el operador puede tomar medidas adicionales para aliviar esos errores en los dispositivos con la ayuda de otras soluciones automatizadas.
Se trata de una interfaz de usuario abierta para todas las aplicaciones que proporciona la flexibilidad necesaria para agregar, quitar y modificar aplicaciones e iconos sin necesidad de desarrollo.
Esto proporciona soporte de autenticación LDAP y acceso a la documentación del producto.
Para lograr los objetivos de la automatización 5G, se necesita una orquestación entre dominios para conectar las partes entre los diferentes dominios que componen la red.
Una vez que los dispositivos de transporte están configurados y configurados en la red, en lugar de seguir el modo tradicional o tradicional de gestión manual de los dispositivos, se puede aprovechar la orquestación entre dominios para lograr simplicidad, agilidad y eficacia.
Los dispositivos activos de red se pueden incorporar al CNC con la especificación de los protocolos a través de los cuales el CDG puede recopilar datos de los dispositivos. Una vez que los dispositivos se incorporan al CNC, la visualización en tiempo real de toda la red L2 y L3 se hace más fácil. El monitoreo de los dispositivos se facilita con la visualización en la GUI relacionada con muchas facetas del estado del dispositivo. La recopilación de datos de los dispositivos comienza a intervalos predeterminados y estos datos tienen un gran valor analítico. Los datos se recopilan a través de SNMP, SSH, MDT, telemetría y varios otros modos como se describió anteriormente.
Estos datos se pueden transmitir a las demás aplicaciones del ecosistema. El CNC permite enviar los datos recogidos al sistema Matrix a través de un bus Kafka. La colección está suscrita a un tema Kafka y el CDG sigue distribuyendo los datos que recopila a este tema, cuyo punto final es Matrix.
Matrix cuenta con varios paneles intuitivos desde los que se pueden visualizar estos datos, y también se pueden realizar varias operaciones analíticas. Estos datos se pueden comprimir juntos mediante la solución Cisco Vitria AIOps para la supervisión de fallos. Siempre que se detectan fallos o anomalías, la herramienta Vitria genera alarmas de forma proactiva para que se puedan tomar las medidas necesarias, evitando así fallos importantes.
Dentro de la suite de trabajo cruzado, algunas aplicaciones pueden orquestar proactivamente el tráfico en una red de transporte, aliviando así los tiempos de inactividad significativos en tiempos de carga pico. Los paquetes de funciones de COE, como Local Congestion Mitigation (LCM) y Bandwidth on Demand (BWoD), vienen al rescate en estos escenarios.
El LCM es una herramienta muy útil para mitigar la congestión dentro de una red e impulsar políticas que toman rutas alternativas liberando la interfaz sobrecargada. Todo esto sucede automáticamente sin que un usuario intente detectar la congestión después de que ya haya ocurrido. LCM utiliza un umbral configurable más allá del cual se considera congestionado.
Una vez que la utilización de una interfaz excede este umbral, LCM proporciona recomendaciones para aliviar la congestión en un nivel de interfaz local. La solución se encarga de dirigir solo la cantidad necesaria de tráfico que prácticamente reduce la congestión por debajo del umbral. La ventaja de esto es que no se desvía todo el tráfico en la interfaz. El usuario puede analizar el conjunto de recomendaciones y, a continuación, elegir la que mejor se adapte. Por lo tanto, LCM pone en marcha las políticas tácticas de ingeniería de tráfico con la ayuda del componente SR-PCE, que ayuda a la eliminación automatizada de la congestión en tiempo real.
La solución BWoD puede funcionar junto con LCM. Si hay una interfaz de alta prioridad que transporta tráfico de voz o de vídeo, el operador desea asegurarse de que la ruta siempre tiene una cantidad específica de ancho de banda disponible. COE permite al usuario crear una ruta de política BWoD y, cuando la BWoD también se configura con un umbral, la supervisión se inicia cada segundo. Tan pronto como se supera el umbral de la interfaz, BWoD salta para crear nuevas políticas de SR o volver a optimizar la ruta existente que se esfuerza por mantener el ancho de banda asignado.
Estos son un par de escenarios que optimizan la trayectoria de transporte y facilitan la automatización del transporte. Mientras que el CNC se puede utilizar junto con otras soluciones para procesar y analizar los datos, los componentes internos del CNC también pueden desempeñar un papel importante en el mantenimiento de la red de transporte con automatización de alta gama que amplía la disponibilidad y la fiabilidad de la red.
En cualquier caso práctico de CLA, los pasos básicos implican:
A continuación se muestra una descripción del flujo de esta solución de Cisco:
Un ejemplo real de cómo puede funcionar la automatización de bucle cercano aprovechando los componentes de Cisco entre dominios se ilustra mejor en el caso de las pérdidas de memoria de los dispositivos. El comando show processes memory detail proporciona los detalles del consumo de memoria de todos los procesos en el router.
Se puede crear un trabajo de recolección de CLI en CNC para permitir que CDG inicie sesión en el router a las cadencias especificadas por el usuario y ejecute el comando
show processes memory detail. El CDG obtiene la salida de este comando y reenvía los datos al bus Kafka. Matrix lee estos datos del bus Kafka y los analiza y transforma para mostrar la información de memoria en sus paneles.
Siempre que el consumo de memoria excede un umbral establecido para los routers, Matrix genera una alarma y reenvía la anomalía al bus Kafka. Vitria AIOps genera entonces un incidente en su tablero leyendo la anomalía del autobús Kafka. Esto se puede visualizar en el panel AIOps que muestra el nombre de host del dispositivo en el que la utilización de la memoria ha superado los límites de seguridad.
Desde la GUI de AIOps, se puede actuar ante esta alarma integrando una API de restablecimiento de dispositivos de Network Service Orchestrator (NSO) (un sistema de gestión de la configuración) que restablece el dispositivo.
También hay un período de enfriamiento en Vitria donde el incidente se mantiene abierto por un tiempo. Durante este tiempo, si Matrix no informa de ninguna fuga en el mismo dispositivo, el incidente se cierra automáticamente. Si no es así, se repite el mismo proceso de restablecimiento del dispositivo. En el proceso, no tiene que haber una sola intervención manual y toda la remediación es manejada por los componentes de dominio cruzado mismos que actúan como prueba de cómo todo el loop es automatizado y resuelto proactivamente de la manera más coherente, en tiempo real.
Desafíos
1. Cambio a la nube
Alojar la aplicación en la nube conlleva los siguientes retos:
- Se necesitan nuevas soluciones de seguridad y gestión de operaciones
- Encontrar casos prácticos y modelos empresariales detrás del perímetro de la nube
- Las nubes deben admitir el alto rendimiento requerido
- Las operaciones, los procesos, la seguridad y la disponibilidad deben cumplir las expectativas de los proveedores de servicios y sus clientes
- Los proveedores de nube ofrecen sus soluciones para facilitar el diseño de la migración de servicios a la nube, que a veces es difícil de adaptar
2. Dudar sobre la automatización
- No poder prever la necesidad de automatización
- Complejidad de las redes de los proveedores
Summary
La automatización y la orquestación de una red 5G es una tarea compleja que debe planificarse e implementarse correctamente desde el principio de un diseño de red.
La complejidad de las redes 5G requiere automatización y orquestación para simplificar las tareas y minimizar la probabilidad de error durante la planificación, la implementación y el funcionamiento.
Información Relacionada
- https://www.cisco.com/c/dam/m/en_us/customer-experience/collateral/5G-automation-architecture-white-paper.pdf
- https://www.cisco.com/c/dam/en/us/td/docs/cloud-systems-management/crosswork-network-controller/3-0/Solution-Workflow-Guide/CNC-3-0-Solution-workflow-guide.pdf
- Soporte técnico y descargas de Cisco
Revisión | Fecha de publicación | Comentarios |
---|---|---|
2.0 |
01-Apr-2024 |
1. Componente asignado: Funcionalidad/Capacidad en los títulos de la sección 3.
2. Caso práctico: se ha añadido una introducción sobre el caso práctico que debe identificarse y, a continuación, codificarse. |
1.0 |
15-Mar-2024 |
Versión inicial |