Noticias

¿Cómo escanea Google los libros?

Google lleva ya escaneados más de 7 millones de libros y ello ha sido posible al uso de una novedosa técnica que permite la digitalización del contenido sin necesidad de tener que escanear, puramente dicho, el libro. A continuación os mostramos la patente en la que Google comenta el método que llevan a cabo para realizar dicha tarea, que sería mucho más ardua de no ser así y tener que realizarla por métodos tradicionales.

Publicado

16 mayo, 2009

por

Jesús Maturana

El servicio que Google ha puesto en marcha para ofrecer libros on-line, previo acuerdo con editores y autores, muestra unas imágenes perfectas de las páginas de los libros en cuestión. Como ya sabemos, la captura del texto se realiza mediante técnicas OCR, pero, vayamos al paso anterior: cómo se escanea el libro.

Según podemos leer en la patente número 7.508.978 del registro de patentes estadounidense, Google hace uso de una novedosa técnica de captación en la que no es necesario digitalizar un libro página tras página pasándolo por un escáner tradicional. Han ideado un sistema que permite capturar las páginas haciendo uso de técnicas de visión estereoscópica, es decir, como nosotros vemos las páginas, en tres dimensiones.

Para ello hacen uso de un proyector de luz infrarroja que emite un patrón (mostrado a continuación) sobre el libro. Tras ello las cámaras infrarrojas captan la distorsión del patrón y crean un modelo 3D de la situación de las páginas que posteriormente con tratamiento de datos de visión estereoscópica se trasladan a dos dimensiones. La imagen real es capturada por las cámaras 305 y 310 que junto con los datos recopilados por la cámara infrarroja se combinan para ofrecer el resultado que podemos ver en la web.