Introducción
Este documento describe cómo configurar y utilizar el Lenguaje de marcado de síntesis de voz (SSML) con Google Text to Speech (Google TTS).
Prerequisites
Requirements
Cisco recomienda que tenga conocimiento sobre estos temas:
- Centro de contacto Webex (WxCC) 2.0
Componentes Utilizados
La información que contiene este documento se basa en estas versiones de software:
The information in this document was created from the devices in a specific lab environment. All of the devices used in this document started with a cleared (default) configuration. Si tiene una red en vivo, asegúrese de entender el posible impacto de cualquier comando.
Antecedentes
El lenguaje de marcado de síntesis de voz permite una mayor personalización de la respuesta de audio de Google Text to Speech. Proporciona detalles sobre las pausas y el formato de audio para acrónimos, fechas, horas, abreviaturas o texto que se puede censurar.
Configuración
Refiérase a Google SSML para encontrar información sobre todos los elementos SSML en Google Cloud Portal.
Aquí hay varios ejemplos de configuración de flujo WxCC con algunos de los elementos SSML:
<speak>
El Lenguaje de marcado de síntesis de voz es una aplicación XML. El elemento raíz es <speak>. Todos los elementos adicionales deben configurarse dentro de las etiquetas de voz. Si coloca texto sin formato en la etiqueta speak, la persona que llama oirá la voz en la configuración TTS predeterminada que se configura en el flujo WxCC.
<speak-as>
Este elemento permite indicar información sobre el tipo de construcción de texto que contiene el elemento. También ayuda a especificar el nivel de detalle proporcionado en el texto contenido.
El elemento <say-as> tiene el atributo requerido, interpret-as, que determina cómo se pronuncia el valor. Los atributos opcionales formato y detalle se pueden utilizar relacionados con el valor interpret-as concreto.
Ejemplo 1:
<speak-as> con interpret-as='currency' como atributo requerido y language='en-US' como atributo opcional. En este ejemplo, la persona que llama escucha: su saldo actual es de 53 dólares y 21 céntimos.
Ejemplo 2:
<speak-as> con interpret-as="ordinal" como el atributo requerido. En esta configuración, la persona que llama escucha su posición en la cola en el formato ordinal, como primero, segundo, etc.