Noticias

Google Docs con soporte OCR

La reciente compra de RECAPTCHA por parte de Google además de su proyecto Google Books está comenzando a dar sus frutos en su servicio web Google Docs. Acaban de anunciar el soporte de reconocimiento de texto en imágenes, también conocido como OCR. Según comentan el soporte de la característica no es perfecto pero sí que funciona bastante bien en imágenes de alta resolución para aplicaciones creadas a través de la API de Google Docs. También han integrado la traducción directa.

Publicado

30 septiembre, 2009

por

Jesús Maturana

Google vuelve a demostrar otra vez la aplicación de su gran potencia de computación dedicada tareas como la ingente digitalización de libros en Google Books. En esta ocasión el reconocimiento óptico de caracteres (OCR) se ha integrado en el servicio de manera de prueba y sólo accesible a través de la API de Google Docs, no para ser utilizado desde el propio servicio, al menos de momento.

Tal y como comentan Jaron Schaeffer y Eric Bidelman del equipo de Google Docs, la API ha sido modificada para soportar OCR añadiendo el parámetro ocr=true. La función de reconocimiento sólo funciona de manera positiva con imágenes de alta resolución y, de momento, hay varias limitaciones, como son tamaño por imagen, 10 Mbytes, formatos de imagen, sólo .png, .jpg o .gif y un tamaño máximo de 25 megapixeles.

En cuanto Google pula la plataforma dará acceso público a través del interfaz web del servicio. De momento sólo puede utilizarse desde aplicaciones creadas por desarrolladores utilizando la API, con el método que han definido en el blog de Google Docs (demostración).

Además de ello, también han anunciado un nuevo parámetro para la API, que permite traducir directamente entre distintos idiomas según se crea o se sube un nuevo archivo, algo, que sí que está integrado para uso público a través de la interfaz de usuario.