Microsoft y su «logro histórico» en la tecnología de reconocimiento de voz

Microsoft

Los investigadores de Microsoft informan que han creado una nueva tecnología de reconocimiento de voz que transcribe el habla coloquial, así como lo hace un ser humano. La tasa de error por palabra del sistema informan que es de un 5,9 por ciento, lo que es aproximadamente igual a los transcriptores profesionales a los que se les pidió trabajar en la mismas grabaciones, de acuerdo con Microsoft.

«Hemos llegado a la paridad con el humano», dijo el científico Xuedong Huang, quien dio la información principal  en un comunicado, llamando a este hito como un «logro histórico».

Para alcanzar el hito, el equipo utilizó una red computacional y un kit de herramientas de Microsoft, como también un sistema de cosecha propia para el aprendizaje profundo que el equipo de investigación dejó disponible en GitHub a través de una licencia de código abierto. El sistema utiliza una tecnología de redes neuronales sobre grupos de palabras similares, lo que permite a los modelos el trabajar eficientemente palabra por palabra.

Las redes neuronales se basan en grandes cantidades de datos llamados «datos de formación» y se establecen para enseñar a los ordenadores que transcriben a reconocer patrones sintácticos en los sonidos. Microsoft planea usar la tecnología en Cortana, su asistente personal de voz en Windows y Xbox Uno, así como en software de transcripción de voz a texto.

Pero la tecnología todavía tiene un largo camino por recorrer antes de que pueda procesar el significado principal (la semántica) y el conocimiento contextual, características claves en el uso del lenguaje cotidiano que necesita ser captado por asistentes personales, como Siri, para procesar las solicitudes y actuar sobre ellos de una manera útil.

«Nos estamos alejando de un mundo donde la gente debe entender a las computadoras del mundo mientras que las computadoras aún no nos entienden a nosotros», dijo Harry Shum, que dirige el grupo de investigación de AI de Microsoft. Sin embargo, pasará un largo tiempo antes de que las computadoras puedan entender el verdadero significado de lo que se dice, advirtió. «La verdadera inteligencia artificial todavía está en un horizonte lejano».


Síguenos en Google News

Un comentario, deja el tuyo

Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: AB Internet Networks 2008 SL
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.

  1.   CARLOS dijo

    Yo creo que es un paso tremendo, el día que podamos interactuar con los dispositivos sin usar periféricos cambiara totalmente la forma de entender la relación del hombre con las maquinas.