Apple consigue que Siri tenga una voz más humana gracias al aprendizaje profundo

Nuevo logo Siri El lanzamiento de iOS 11 está a la vuelta de la esquina, y Apple ha publicado un documento de investigación en el que detalla sus métodos para mejorar Siri y hacer que el asistente digital tenga una voz más natural, con la ayuda del machine learning y el deep learning. Además de capturar varias horas de audio de alta calidad que se pueden cortar en trozos para crear respuestas de voz, los desarrolladores se enfrentan al reto de conseguir que la prosodia – los patrones de estrés y entonación en el lenguaje hablado – sea la correcta. Esto se ve agravado por el hecho de que estos procesos pueden llegar a resultar realmente pesados o complejos para un procesador, por lo que los métodos simples de encadenar sonidos juntos serían demasiado para ser manejados por un teléfono. Pero aquí es donde entra en juego el aprendizaje de máquina. Con suficientes datos de entrenamiento, puedes ayudar a un sistema de texto a voz a entender cómo seleccionar segmentos de audio que se unen para crear respuestas naturales. Para iOS 11, los ingenieros de Apple trabajaron con un nuevo actor de voz femenina para grabar 20 horas de habla en inglés de Estados Unidos y generar entre 1 y 2 millones de segmentos de audio, los cuales fueron utilizados para entrenar un sistema de aprendizaje profundo. El equipo señaló en su artículo que los sujetos de prueba preferían mayoritariamente la nueva versión sobre la antigua que se encuentra en iOS 9 desde el año 2015. Los resultados hablan por sí mismos: las instrucciones de navegación de Siri, las respuestas a las preguntas de trivia y las notificaciones de “solicitud completada” suenan mucho menos robóticas que hace dos años. voz siri Si quieres ver el artículo completo publicado por Apple, puedes hacerlo haciendo clic en el enlace anterior. Además, al final de dicho artículo verás un ejemplo en donde se compara la evolución de la voz de Siri desde iOS 9 hasta iOS 11. Si duda en iOS 11 la voz suena muchísimo más humana.

Fuente

About Domadis Cabrera

Geek por naturaleza. Technorati por pasión. Emprendedor y amante del buen diseño. Disfruto probando cualquier cosa relacionada con la tecnología, da igual si es software o hardware. Viajero frecuente y amante de la adrenalina. Me divierte solucionar problemas y puedes seguirme en tu red social favorita, sólo tienes que buscarme por mi nombre.

Últimos comentarios

  1. Alexander Monsivais 29 agosto, 2017

Deja tu respuesta

d74ca0a187f0ec6b40686c25dcd3d262557c7e84d8ef45591f