El reconocimiento de voz avanza gracias a las redes neuronales

El reconocimiento de voz avanza gracias a las redes neuronales
29 de agosto, 2011

Dos investigadores de Microsoft Research presentarán durante el día de hoy un informe en el que acercan a la comunidad tecnológica sus conclusiones sobre sus avances en el terreno del reconocimiento de voz. Según estos dos investigadores, aún es posible avanzar de forma notable en este campo.

Dong Yu, de Microsoft Research Redmond, y Frank Seide, de Microsoft Research Asia, han acudido al evento International Speech Communication Association que está celebrándose estos días en Florencia, Italia. En dichas conferencias se trata el futuro de las tecnologías de reconocimiento de voz, y tanto Yu como Seide tienen mucho que decir allí.

Mientras que los sistemas comerciales ya proporcionan modelos de reconocimiento eficientes basados en el entrenamiento, estos dos investigadores han aplicado un concepto que no se había retomado en este campo desde hace tiempo. Se trata de las redes neuronales, que son modelos matemáticos que simulan en cierta medida el funcionamiento del cerebro humano.

Hasta la fecha los modelos usados en reconocimiento de voz superaban en rendimiento a las redes neuronales, pero el uso de “redes neuronales profundas” (DNNs) ha provocado un avance notable en la eficiencia de estos motores de reconocimiento, que en las pruebas internas de Microsoft obtuvieron tasas de error por palabra del 18,5%, una mejora del 33% sobre los resultados de un sistema de reconocimiento actual.

La aplicación de esta tecnología al software actual permitirá una eficiencia y precisión aún mayores en estos sistemas, lo que permitirá controlar con más garantías todo tipo de dispositivos a través de la voz.

  • Share This