Google compra reCAPTCHA

Google compra reCAPTCHA
17 de septiembre, 2009

La compañía de Mountain View acaba de anunciar la adquisición de la compañía reCAPTCHA que realiza una doble función con su servicio: antispam y mejoras para la digitalización de libros mediante OCR. Ambas muy apreciadas por Google ya que el spam es un mal común en la red de redes y la segunda de ellas de mucha utilidad para la ingente tarea de digitalización que está llevando a cabo Google con sus proyectos Google Books y Google News Archive Search. Sin duda alguna, una compra inteligente.

reCAPTCHA es una compañía que se encarga de ofrecer un sistema de verificación de identidad para sitios web, utilizando los tradicionales CAPTCHAs, imágenes con texto incrustado que frenan, en cierta manera, el uso de bots con finalidad de producción de spam. Lo más interesante del método de reCAPTCHA es que las imágenes que contienen texto son fragmentos de la digitalización mediante OCR de libros de texto que el ordenador no ha sido capaz de convertir a texto directamente, por lo que cumple esa doble funcionalidad antispam y mejora de la digitalización de libros.

Dicha compra tiene mucho sentido para Google ya que el proyecto Google Books se realiza mediante OCR y, por tanto, se podría beneficiar de la gran red de sitios web, más de 100.000 (como podemos leer en MuyInternet), que utilizan el sistema de verificación de identidad de la compañía adquirida.

El sistema de verificación de reCAPTCHA fue el producto de un proyecto de la Escuela de Ciencias de la computación de la Universidad de Carnegie Mellon (Nueva York) y actualmente hace que las labores de digitalización de libros cumplan un doble y útil cometido, acelerando el proceso de digitalización y protegiendo contra spam a los sitios web adheridos.

  • Share This