Foro

Avatar de Carlos-Movistar
Carlos-Movistar
Antiguo Moderador
04-03-2011

wget

Al final me toca meterme como siempre en todos los charcos. :smileyvery-happy:

 

Venga, lo inicio yo, que además, me parece que va a ser un subforo que si me ayudáis será de los que más "molen".

 

He pensado un rato largo con qué os podría sorprender: si con algo 2.0, algo "cool" y de moda, algo superextravagante, o algo marca Movistar, pero al final creo que empezaré justo con lo contrario. Espartano a más no poder.

 

Amigos de la Comunidad, os presento, a los que no lo conozcáis, a .... wget  :smileyhappy:

 

Dice la Wikipedia (resumiendo, claro):


"GNU Wget es una herramienta de software libre que Permite la descarga de contenidos desde servidores Web de una forma simple. Ofrece entre otras cosas la descarga de mirrors (espejos) complejos de forma recursiva, conversión de enlaces para la visualización de contenidos HTML localmente, soporte para proxies...

 

Es un programa utilizado a través de línea de comandos, principalmente en sistemas de UNIX/Linux. Escrito en el lenguaje de programación C, Wget puede ser fácilmente instalado en sistemas derivados de UNIX, y ha sido portado a muchas interfaces gráficas de usuario (GUI) y aplicaciones gráficas de descarga como Gwget[1] para GNOME, wGetGUI[2] y VisualWget[3] para Microsoft Windows, Wget 1.10.2r2[4] para Mac OS X."

 

Los que uséis Linux seguro que lo conocéis, pero en Windows creo que es un desconocido. ¿Y qué podemos hacer con wget?

Para lo que más se usa es para automatizar descargas.

 

Lo mejor es probarlo y que lo veáis vosotros mismos. Para Windows se puede descargar aquí:

http://sourceforge.net/projects/gnuwin32/files/wget/1.11.4-1/wget-1.11.4-1-setup.exe/download

 

wget_1.jpg

 

Una vez instalado (con total garantía del compilado original pues es GNU)  debemos situarnos desde "Símbolo del sistema" en la carpeta donde se instaló para poder ejecutarlo:

 

2.gwet.png

 

NOTA: Para evitar tener que ponernos siempre en ese directorio parta ejecutar wget podemos meter en el PATH esa ruta:

wget_3.png

 

Sea de la forma que sea, nos encontramos dispuestos a escribir por primera vez algo con el wget:

 

wget_4.png

 

Lo escribimos a secas y ... No hace nada , nos dice que debemos meter algún parámetro y la/s url. Bien pues vamos con un caso práctico, (en siguientes mensajes del hilo podemos construir más ejemplos y sacarle un partido extraordinario a esta herramienta). Vamos a decirle a wget que nos descargue todo pdf que encuentre dentro de una URL de forma recursiva hasta una profundidad de 3 (esto significa URL dentro de otra URL dentro de otra URL)

 

Lo hacemos de esta forma:


wget -r -l3 -H -t1 -nd -N -np -A.pdf -erobots=off http://www.temariosyapuntesgratis.com/

 

Lo podéis copiar y pegar en la consola (se pega en el Símbolo del sistema con el botón derecho => pegar ) :smileywink:

 

¿Qué hace toda esta batería de parámetros:

 

-r =recursivo

-l3 hasta nivel 3

-H=ir a host diferentes en los recursivos

-t1=1 reintento

-nd=no escales por encima de la URL padre

-A.pdf =extensiones pdf

-erobots=off  = wget no leerá el contenido de los erobots

 

Veréis como poco a poco va descargándose todo pdf que encuentra en la prospección de esa Web hasta 3 de profundidad, ¿a que es potente? :smileyhappy:

 

wget_5.png

 

No olvidéis no obstante que esos contenidos pueden estar sujetos a ciertos derechos de autor, pero conociéndolos y respetándolos nunca habrá ningún problema con este tipo de extracción automatizada. 

 

¿Qué os parece? ¿Lo usabais ya?

:smileyhappy:

 

3 Respuestas

Las respuestas se han desactivado para esta discusión
  • Avatar de Carlos-Movistar
    Carlos-Movistar
    Antiguo Moderador
    06-03-2011

    El inicio del post indiqué cómo poder disponer de wget para Windows. Ahora os dejo el enlace donde se encuentra el precompilado para Mac OS X:

     

    http://www.merenbach.com/software/wget

     

    Se instala prácticamente sólo y es accesible desde cualquier zona del path donde nos encontremos. Va bien, probado por un servidor. :smileywink:

     

     

    NOTA:

    En el ejemplar de marzo de 2006 de Linux Magazine se recoge un pequeño reportaje de este "comando". Aunque sea una revista para Linux, el comando una vez instalado es prácticamente idéntico para Windows, y para Mac sobretodo.

     

    Aquí podéis leerlo:

    http://www.linux-magazine.es/issue/15/

     

    Y como estáis viendo los que no conozcáis esta web de "Linux New Media Spain", esta editorial libera sus revistas de Linux con cierta antigüedad, así que quien tenga tiempo y ganas se puede "empapar" de pingüino de los pies a la cabeza. :smileyvery-happy: Ya sabéis que dicen que el saber no ocupa lugar.

     

    Saludos.

  • Avatar de Carlos-Movistar
    Carlos-Movistar
    Antiguo Moderador
    05-03-2011

    wget es un clásico Andrés. Seguro que te va a ser útil. Tiene alguna GUI construída por terceros, pero trata de estudiarlo directamente: "a pelo".Hay mucha documentación sobre su uso. Aquí sólo puse un ejemplín de andar por casa.

     

    Aprenderás por este hilo (cuando crezca claro jejeje)  y por otros sitios que da mucho de sí. :smileywink:

  • Avatar de Andres
    Andres
    Quítamelo todo menos el 5G
    04-03-2011

    Me estas dando en mis puntos débiles con tus respuestas!! Un calenton de cabeza hoy en (SOM) Sistemas Operativos Monopuesto, pero con algo aun mas sencillo, como es desde el cmd, crear carpetas, ficheros, txt y llevamos un cacao tremendo.

     

    Entonces sino he entendido mal, ¿Tu puedes ordenarle por ejemplo que descarge todos los PDF de www.movistar.es y los descarga?