Los investigadores de Microsoft informan que han creado una nueva tecnología de reconocimiento de voz que transcribe el habla coloquial, así como lo hace un ser humano. La tasa de error por palabra del sistema informan que es de un 5,9 por ciento, lo que es aproximadamente igual a los transcriptores profesionales a los que se les pidió trabajar en la mismas grabaciones, de acuerdo con Microsoft.
«Hemos llegado a la paridad con el humano», dijo el científico Xuedong Huang, quien dio la información principal en un comunicado, llamando a este hito como un «logro histórico».
Para alcanzar el hito, el equipo utilizó una red computacional y un kit de herramientas de Microsoft, como también un sistema de cosecha propia para el aprendizaje profundo que el equipo de investigación dejó disponible en GitHub a través de una licencia de código abierto. El sistema utiliza una tecnología de redes neuronales sobre grupos de palabras similares, lo que permite a los modelos el trabajar eficientemente palabra por palabra.
Las redes neuronales se basan en grandes cantidades de datos llamados «datos de formación» y se establecen para enseñar a los ordenadores que transcriben a reconocer patrones sintácticos en los sonidos. Microsoft planea usar la tecnología en Cortana, su asistente personal de voz en Windows y Xbox Uno, así como en software de transcripción de voz a texto.
Pero la tecnología todavía tiene un largo camino por recorrer antes de que pueda procesar el significado principal (la semántica) y el conocimiento contextual, características claves en el uso del lenguaje cotidiano que necesita ser captado por asistentes personales, como Siri, para procesar las solicitudes y actuar sobre ellos de una manera útil.
«Nos estamos alejando de un mundo donde la gente debe entender a las computadoras del mundo mientras que las computadoras aún no nos entienden a nosotros», dijo Harry Shum, que dirige el grupo de investigación de AI de Microsoft. Sin embargo, pasará un largo tiempo antes de que las computadoras puedan entender el verdadero significado de lo que se dice, advirtió. «La verdadera inteligencia artificial todavía está en un horizonte lejano».
Un comentario, deja el tuyo
Yo creo que es un paso tremendo, el día que podamos interactuar con los dispositivos sin usar periféricos cambiara totalmente la forma de entender la relación del hombre con las maquinas.