Rescata webs antiguas

Rescata webs antiguas
17 de junio, 2009

Internet es una red de redes mundial, pero cuando una web ha sido borrada o está temporalmente inaccesible por cualquier motivo, los usuarios web tienen muy pocas posibilidades de acceder a ese sitio web. Las posibilidades incluyen la búsqueda en la caché de Google, Web Archive o servicios similares de caché que guardan una copia de la página en cuestión, pero no es lo ideal. La utilidad Warrick puede ser mucho más eficaz.

La solución de usar Google para recuperar antiguas web ya no dispoibles no es la idónea, porque los Web caches son una buena solución para ver una única página web pero no es un servicio cómodo cuando se necesita acceder a varios sitios. Entre los casos que también pueden ocurrir es que los administradores de la página web hayan perdido su sitio web alojado en un servidor y necesiten restaurar las páginas desde las caches de Internet.

Warrick es un script que intenta restaurar los sitios web desde varias fuentes de Internet incluyendo la de Archive.org y tres populares buscadores como son Google, Yahoo! y Bing. Su instalación es un poco mas compleja que la de un ejecutable pero se puede hacer aunque seas un usuario inexperto. El programa está disponible tanto para Windows como para Linux. Los usuarios de Windows deberán instalar previamente la herramienta Active Perl antes de ejecutar el script desde la línea de comandos.

Los desarrolladores han creado una guía paso a paso para los usuarios de Windows sobre cómo instalar y utilizar el script en este sistema operativo. La página web de Warrick contiene ejemplos de cómo usar el script para restaurar páginas sencillas e introducir proyectos web. El comando warrick.pl-r-WR-c ia http://yourwebsite.com/ reconstruirá todas las páginas del sitio web que se almacenan en al menos una de las fuentes on-line utilizadas en el proceso de recuperación. Las siguientes instrucciones te mostrarán cómo instalar y ejecutar Warrick en un ordenador gobernado por XP:

Paso 1. Instalación del programa PERL

En primer lugar descarga e Instala el programa ActivePerl. Después la aplicacion te pedirá que instales SOAP-Lite utilizando el Package Manager de ActivePerl. Para conseguirlo haz clic en Inicio -> Programas -> ActiveState ActivePerl ->Perl Package Manager. Se abrirá una ventana de línea de comandos y tendrás que introducir a continuación lo siguiente: ppm> install SOAP-Lit. Una vez instalado esto puedes salir del package Manager de perl.

Paso 2. Ejecución de Warrick

A continuación abre otra vez una ventana de símbolo de sistema desde Inicio -> Todos los programas -> Accesorios -> símbolo del sistema. En la ventana negra que aparecerá introduce: cd c:\Warrick (esto le llevará al directorio de Warrick, sustituye C: por el disco duro donde lo tengas instalado). Ahora introduce: warrick.pl -r -wr ia -c http://yourwebsite.com/ (yourwebsite.com es la dirección de la página antigua que queremos recuperar).En la ventana verás información de salida de Warrick así como información de la página web reconstruida.

Cuando termina Warrick verá una carpeta llamada yourwebsite.com en el directorio de Warrick (C: \ Warrick \ yourwebsite.com) que contiene todos los archivos que se han recuperado.

  • Share This