Re: Wget et aspiration sélective de site(flickr)

Page principale

Répondre à ce message
Auteur: Olivier Allard-Jacquin
Date:  
À: ML guilde
Anciens-sujets: Wget et aspiration sélective de site (flickr)
Sujet: Re: Wget et aspiration sélective de site(flickr)
    Bonjour,

Le 20/01/2013 00:27, Gwenn Boussard a écrit :
> Bonsoir,
> J'ai un compte flickr que j'aimerais aspirer :
> http://www.flickr.com/photos/ll0zz/
> J'ai envie de sauvegarder les photos (y compris en résolution max) et
> les commentaires, c'est pas grave si l'affichage n'est pas nickel.
>
> Après plusieurs tâtonnements avec wget (pour aspirer l'essentiel sans
> prendre tout le web avec), j'ai tenté :
> wget -r -k -E -p -i flickrUrls.txt
> --exclude-directories=commons,explore,cameras,about,gettyimages,help,jobs,mail,map,people,services,signup,tour,upgrade,photos,groups,account,analog,android,bestpractices,apps,creativecommons,guidelines,iconbuilder,placeswget
>
> Avec flickrUrls.txt qui contient
> http://www.flickr.com/photos/ll0zz/page1/ [...]
> http://www.flickr.com/photos/ll0zz/page20/
> Mais ça télécharge énormément de choses sans enregistrer les images.
>
> Est-ce que quelqu'un voit où est le problème ? Ou encore mieux, est-ce
> que quelqu'un a déjà aspiré un compte flickr ?
>
> Cordialement,


    De ce que j'ai vu, il y a beaucoup de Javascript sur ce site, qui
"protègent" l'accès aux liens et aux images. Raison laquelle wget est
assez limité.


    Tu peux regarder sur Google, apparemment c'est une problématique qui
revient assez souvent :


https://www.google.fr/#q=flickr+wget

il y a notamment (non testé):
http://wiki.tcl.tk/15303
http://www.unix.com/shell-programming-scripting/195681-grab-all-jpgs-flickr.html

Ou plus simplement:
https://www.google.fr/#q=flickr+download

    Cordialement,


                    Olivier
-- 
~~~~~~~  _____/\_____  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Phoenix /   _ \/ _   \    Olivier Allard-Jacquin
       /   / \  / \   \   Web:  http://olivieraj.free.fr/
      /___/  /  \  \___\  Mail: olivieraj@???
~~~~ /////  ///\\\  \\\\\ ~~~~~~~~~~~~~~~~~~~~~~~ Linux Powered !!