Dragon NaturallySpeaking 10

Dragon NaturallySpeaking 10
16 de febrero, 2009

Los programas de reconocimiento de voz llevan tiempo tratando de demostrar al gran público las ventajas de poder hablarle al ordenador directamente, y Dragon NaturallySpeaking 10 Preferred es probablemente el más potente de todos. Las mejoras realizadas han permitido aumentar la precisión y velocidad de este software que nos permite dictar textos o interactuar con el sistema operativo a través de nuestra propia voz. 

 

Hoy en día hay cientos de millones de personas que utilizan el ordenador a diario para sus tareas profesionales y personales. Teclear para escribir direcciones de páginas web, correos electrónicos, o cualquier tipo de documento que necesitemos procesar es una de las tareas más frecuentes para todo tipo de usuarios. La mayoría de estos usuarios no han aprendido mecanografía o no tienen mucha soltura al teclado y por lo tanto la velocidad de escritura es relativamente baja en muchos de esos casos.

 

 

Precisamente para este tipo de situaciones los programas de reconocimiento de voz se sitúan como una alternativa muy interesante para acelerar la escritura de documentos e incluso la interacción con nuestros ordenadores. Dragon NaturallySpeaking 10 es la última edición de este popular programa de reconocimiento de voz en el que se incluyen varias mejoras sobre sus anteriores versiones. Por ejemplo, es un 20% más preciso que su predecesor y además ofrece un 50% más de velocidad de reconocimiento. Esta afirmación de Nuance -la empresa desarrolladora de esta aplicación- se puede verificar rápidamente nada más comenzar a utilizar este programa.

 

Instalación y puesta en marcha

 

La instalación de Dragon NaturallySpeaking 10 es muy sencilla, y lleva tan sólo 10 minutos. Necesitaremos al menos 512 Mbytes de RAM y 1 Gbyte de espacio en disco duro, y el proceso conllevará la instalación además del denominado Visual C++ 8.0 Runtime, un componente imprescindible de Microsoft que permite utilizar este software en Windows XP, 2000, y por supuesto Windows Vista.

 

 

Tras la instalación se ejecuta un pequeño asistente que nos permite configurar el dispositivo de entrada de sonido, es decir, nuestro micrófono. Con esta edición se incluye un auricular con micrófono incorporado que además dispone de un sistema de cancelación de ruidos, pero el método de ajuste del auricular es algo incómodo, por lo que probablemente muchos usuarios se sientan perfectamente cómodos con sus auriculares con micrófonos integrados si ya disponían este tipo de periférico.

 

 

Una vez configurado el microfono se nos da oportunidad de entrenar al programa para crear el perfil de usuario que se ajuste a nuestro acento  y nuestra pronunciación. Aunque no sea estrictamente necesario, esta opción es la más recomendable para comenzar a usar del programa lo antes posible de forma que la precisión del reconocimiento de Dragon NaturallySpeaking 10 sea lo más alta posible.

 

 

El entrenamiento dura aproximadamente cinco minutos y consiste en la lectura de un texto ya predefinido con el que Dragon NaturallySpeaking nos permite ajustar sus parámetros de dictado, y tras reconocer nuestra voz al leer uno de los textos disponibles se procederá a generar un perfil usuario perfectamente adaptado a nuestro tipo de habla.

 

Una precisión asombrosa

 

En Dragon NaturallySpeaking 10 se proporcionan una serie de herramientas para poder comenzar a dictar casi de forma inmediata. El denominado DragonPad es un editor de textos integrado con la aplicación que nos permite comenzar a hablar al dictado en cualquier momento, pero en realidad no es necesario usar DragonPad salvo para las pruebas preliminares, ya que Dragon NaturallySpeaking 10 se integra con cualquier caja de introducción de texto que podamos imaginar. Formularios web, campos de introducción de cadenas de texto, y por supuesto cualquier procesador de textos o editor que manejemos habitualmente en nuestras sesiones de trabajo serán candidatos perfectos para el uso de esta herramienta.

 

 

Obviamente existen ciertas aplicaciones que están más integradas y capacitadas para el trabajo con Dragon NaturallySpeaking. Entre ellas destacan la suite ofimática Office de Microsoft, el procesador de textos Corel WordPerfect, el cliente de correo electrónico Microsoft Outlook Express, el navegador Microsoft Internet Explorer y otra serie de herramientas que además de responder a nuestro dictado pueden ser manejadas y controladas mediante órdenes de voz específicamente creadas para estos programas.

 

 

No obstante, esa integración es igualmente notable en prácticamente cualquier aplicación que queramos utilizar en la que tengamos que escribir datos. Dictar un post en un blog o una noticia en un CMS cualquiera no tiene mayor complicación, y basta situar el puntero del ratón en la ventana adecuada para comenzar a dictar inmediatamente.

 

 

Una vez iniciado Dragon NaturallySpeaking, tenemos una serie de modos de representación de la ventana de la aplicación. Una de las más cómodas es probablemente la ventana “Sígueme” que simplemente se acopla a la ventana activa en cada momento. En esta pequeña ventana aparece el modo de funcionamiento del programa (micrófono activo, micrófono durmiendo, o micrófono apagado), además de la barra de menús de la aplicación, que nos permitirán acceder a todas las prestaciones de software y a las características de entrenamiento avanzado de las que hablamos más adelante.

 

 

Hay distintas formas de activar y apagar el micrófono para comenzar el dictado o detenerlo. Por ejemplo con la orden “A dormir” le indicaremos a Dragon NaturallySpeaking que deje de reconocer nuestra voz momentáneamente. Si queremos volver a activar el micrófono, basta con que digamos claramente ante el micrófono las palabras “A trabajar”. Esos pequeños comandos de voz se complementan con otra serie de comandos que nos permiten editar el texto directamente, evitando palabras erróneas, deletreandolas, o añadiendo estilos como cursivas y negritas al texto.

 

Ese mismo principio se aplica si queremos aplicar el control de diversos programas, y por ejemplo podremos utilizar combinaciones de palabras específicas para buscar mapas en la web, definiciones en la Wikipedia, o escribir correos electrónicos a nuestros contactos.

 

El entrenamiento lleva al éxito

 

Como suele suceder con este tipo de aplicaciones, el entrenamiento es vital para una precisión cada vez mayor. Aunque Dragon NaturallySpeaking dispone de una precisión muy alta, existen situaciones en las que su capacidad se pone a prueba. Los lenguajes técnicos y con un vocabulario específico ponen en problemas a esta aplicación, pero precisamente para afinar este comportamiento existe la opción de entrenar a Dragon NaturallySpeaking con nuevas palabras que podemos añadir de distintas formas.

 

 

Por ejemplo, podremos indicarle a Dragon NaturallySpeaking que queremos entrenar una palabra en concreto. En nuestras pruebas con textos informático nos hemos encontrado con que los nombres de empresas, de aplicaciones, o de productos de informática no se reconocían correctamente. Sin embargo, al entrenar al programa para que reconociese esos términos (sobre todo deletrando correctamente dichas palabras), los errores en el reconocimiento de ciertas palabras y términos técnicos fueron eliminándose gradualmente.

 

 

Otra forma de entrenar al programa para que el vocabulario se enriquezca consiste en la importación de diccionarios de palabras. En Dragon NaturallySpeaking encontramos un asistente que nos permite extraer palabras de documentos que mantengamos nuestro disco duro. Esa misma extracción puede también realizarse a partir de nuestros correos electrónicos, aunque sólo si disponemos de un cliente soportado por la aplicación, como Outlook Express. Así pues una las opciones más recomendables para mejorar el vocabulario del Dragon NaturallySpeaking consiste en ejecutar el asistente e importar una lista de documentos que ya tengamos preparados en los que se incluyan palabras técnicas o que utilicemos habitualmente.

 

 

Dicho asistente detectará las palabras desconocidas y nos informará de que puede añadirlas al vocabulario para que el reconocimiento de voz ante estas situaciones se mejore notablemente. Esta parte de la aplicación es indispensable para poder afinar el comportamiento de un programa que de serie tiene una precisión excelente, pero que puede resultar algo decepcionante cuando empezamos utilizar términos muy específicos de nuestro vocabulario. De hecho existen ediciones específicas de Dragon NaturallySpeaking para cierto tipo de ramas del conocimiento como la medicina o el derecho.

 

Conclusiones

 

Obviamente cuando nos encontramos con un programa de estas características la dificultad reside en acostumbrarse a pensar lo que vamos a decir antes de decirlo. Si logramos expresar nuestras ideas de forma correcta y con una buena velocidad, comprobaremos como la redacción de todo tipo de textos es muchísimo más rápida que si la realizáramos escribiendo esos mismos textos con el teclado. De hecho, en Dragon NaturallySpeaking existen una serie de algoritmos que permiten reconocer palabras según el contexto, y corregir en tiempo real ciertos términos a medida que completamos las frases.

 

 

El dictado de textos y el control de todas las operaciones de ordenador son posibles gracias a una aplicación que reconoce el habla natural, sin necesidad de realizar pausas entre palabras o de utilizar el programa hablando como si estuviéramos dictando un telegrama, algo típico en los viejos programas de reconocimiento de voz. Si logramos acostumbrarnos a este tipo de utilización, ahorraremos una gran cantidad de tiempo al escribir todo tipo de textos. Por supuesto, todo este análisis se ha realizado al dictado haciendo uso de Dragon NaturallySpeaking 10 Preferred. No podía ser de otro modo.

 

  • Share This