Apple consigue que Siri tenga una voz más humana gracias al aprendizaje profundo
El lanzamiento de iOS 11 está a la vuelta de la esquina, y Apple ha publicado un documento de investigación en el que detalla sus métodos para mejorar Siri y hacer que el asistente digital tenga una voz más natural, con la ayuda del machine learning y el deep learning. Además de capturar varias horas de audio de alta calidad que se pueden cortar en trozos para crear respuestas de voz, los desarrolladores se enfrentan al reto de conseguir que la prosodia – los patrones de estrés y entonación en el lenguaje hablado – sea la correcta. Esto se ve agravado por el hecho de que estos procesos pueden llegar a resultar realmente pesados o complejos para un procesador, por lo que los métodos simples de encadenar sonidos juntos serían demasiado para ser manejados por un teléfono. Pero aquí es donde entra en juego el aprendizaje de máquina. Con suficientes datos de entrenamiento, puedes ayudar a un sistema de texto a voz a entender cómo seleccionar segmentos de audio que se unen para crear respuestas naturales. Para iOS 11, los ingenieros de Apple trabajaron con un nuevo actor de voz femenina para grabar 20 horas de habla en inglés de Estados Unidos y generar entre 1 y 2 millones de segmentos de audio, los cuales fueron utilizados para entrenar un sistema de aprendizaje profundo. El equipo señaló en su artículo que los sujetos de prueba preferían mayoritariamente la nueva versión sobre la antigua que se encuentra en iOS 9 desde el año 2015. Los resultados hablan por sí mismos: las instrucciones de navegación de Siri, las respuestas a las preguntas de trivia y las notificaciones de "solicitud completada" suenan mucho menos robóticas que hace dos años. Si quieres ver el artículo completo publicado por Apple, puedes hacerlo haciendo clic en el enlace anterior. Además, al final de dicho artículo verás un ejemplo en donde se compara la evolución de la voz de Siri desde iOS 9 hasta iOS 11. Si duda en iOS 11 la voz suena muchísimo más humana.
Alexander Monsivais
22 agosto, 2017No está el enlace a la publicación de Apple.