Descargar sitio web con WGET.

Publicado el 2009/02/27 en Internet, Lana / Trabajo - Comentarios: 3 comentarios »

Utilizar WGET para descargar páginas web y su visionado offline, o meter en CDs, como en el caso que me ocupa. Habría que tener en cuenta que si el sitio web, tiene fichero robots.txt, wget hará caso de él y no descargará las exclusiones, por tanto si es posible quitarlo, mejor.

Para MacOS X Leopard puedes descargar WGET desde wget para Leopard.

Hay otras opciones quizá más cómodas, sobre todo si tienes pánico del Terminal, pero esta es Open Source y funciona.

En el terminal:

wget -r -p -E -k http://www.sitioweb.com/

-r: descarga de todas las carpetas (recursiva)
-p: descarga de todo lo necesario (imágenes, js, etc.)
-E: añadir extensión .html a los ficheros descargados
-k: convertir los enlaces a los ficheros locales.

3 Comentarios en “Descargar sitio web con WGET.”

  1. dinpel dijo el:

    Gracias por la explicación pero tengo una duda, si me descargo una web y luego la web actualiza y solo quiero descargarme lo que actualizado y no volver a descargar de nuevo todo ? Como lo debo hacer ? Gracias y un saludo.

  2. rafa espada dijo el:

    Ummm no sé si será posible… o si hay que utilizar otra herramienta que analice el contenido de las páginas ya que wget sólo mira los ficheros y los enlaces y no el contenido.

  3. demonio dijo el:

    para solo actualizar los archivos que se han modificando se utiliza la opcion -N

Déjame un comentario