Microsoft ha actualizado las ‘Expresiones de audio de Copilot’ para habilitar un nuevo modo de guion, con el que el asistente de inteligencia artificial generativa convierte un texto en una lectura textual.
Las ‘Expresiones de audio de Copilot’ es una herramienta disponible en Copilot Labs que permite generar audios a partir de una descripción, personalizada tanto en el modo y la voz como en el estilo.
Así, es posible seleccionar el modo Emotivo, que mejora las palabras con emociones, o el modo Historia, que crea historias con varios estilos. A ellos se une ahora un modo Guion, que convierte el texto en una lectura textual.
Mientras que con los modos Historia y Emotivo, genera un audio con una historia inventada a partir de la descripción, en el modo Guion el texto se lee tal cual.
Este nuevo modo está impulsado por el modelo propio MAI-Voice-1, como ha informado el director ejecutivo de Microsoft AI, Mustafa Suleyman, en una publicación compartida en la red social X.
Microsoft presentó MAI-Voice-1 a finales de agosto. Entonces, explicó que genera un audio “expresivo de alta fidelidad en escenarios con uno o varios altavoces” en menos de un segundo y con una duración de un minuto completo.
Las ‘Expresiones de audio de Copilot’ permiten elegir la voz de la narración de entre nueve opciones, y un estilo, como alegría, tristeza o alivio. Por el momento, solo está disponible para el inglés, tanto en la indicación en texto como en el audio que se genera.