Télécharger et aspirer les éléments d’un site avec des outils gratuits

Voici les outils gratuits pour aspirer un site web ou télécharger tous ses éléments un à un.

Internet est toujours accessible, où que vous soyez… jusqu’à ce que vous ne le captiez plus. Peut-être que vous avez un long vol à faire et que vous avez besoin d’un peu de lecture, peut-être que vous voulez juste sauvegarder un site web pour le garder en lieu sûr. Quelle que soit votre raison, voici comment vous pouvez télécharger à peu près tout ce que vous rencontrez sur internet avec des outils uniquement gratuits.

Pour enregistrer rapidement une page Web

Vous ne le savez peut-être pas, mais votre navigateur internet peut enregistrer des pages Web et d’autres éléments. Dans Chrome, cliquez avec le bouton droit de la souris sur n’importe quelle page et choisissez Enregistrer sous pour enregistrer la page Web sur votre disque dur. Vous obtiendrez tout le texte et la plupart des images, mais pas de médias intégrés comme les vidéos.

Le processus est similaire avec Firefox. Cliquez à nouveau sur le bouton droit de la souris sur une zone vide de la page, choisissez Enregistrer la page sous dans le menu qui s’affiche et donnez un nom à votre page. En dehors des vidéos en streaming, de l’audio ou des éléments interactifs compliqués, vous devriez avoir un rendu fac-similé de cette page web sur votre système local.

Dans Safari, ouvrez une page, puis choisissez Fichier et Enregistrer sous. Donnez un nom à votre nouveau fichier, assurez-vous que le format “Web Archive” est sélectionné, et vous avez une copie conforme du site sur lequel vous étiez. Attention : même les publicités et les codes JavaScript sont copiés, vous aurez une copie conforme du site hors-ligne. Par contre, les médias intégrés sont là aussi oubliés.

Ces outils de sauvegarde sont pratiques mais pas très complets – ils ont été conçus à une époque plus simple où les pages Web étaient statiques, comme des blocs simples de textes et d’images affichés dans le navigateur. L’option est pratique, mais vous remarquerez sûrement des éléments manquants en utilisant cette méthode.

Pour sauvegarder une page Web avec ses compléments

⇒ Les services de lecture hors-ligne

Quelques services permettent d’obtenir des copies de pages web même en étant hors-ligne :

Ils vous donneront des pages Web sous une forme simplifiée, mais n’aspirent pas une page dans son intégralité.

⇒ Les aspirateurs de sites web

L’un des outils les plus anciens et les plus connus pour un travail d’aspiration complet est HTTrack pour Windows, qui crée plus ou moins le cache complet d’un site sur votre disque local. C’est comme si vous consultiez le site lui-même, mais tout en étant hors ligne, y compris les images, les polices et les liens vers les pages du même domaine. Vos téléchargements peuvent être catégorisés et couvrir plusieurs URL à l’intérieur d’un même projet.

Une autre option est Cyotek WebCopy, toujours pour Windows. Son fonctionnement est très similaire, rampant autour d’un site et téléchargeant absolument tout ce qui s’y trouve, y compris les images et les vidéos (tant qu’elles sont hébergées sur le site et qu’elles ne sont pas diffusées en continu depuis un autre endroit). C’est encore plus complet et convivial que HTTrack, mais ils valent tous les deux la peine d’être découverts.

Si vous êtes du côté de macOS, essayez SiteSucker. Il vous coûtera 5 euros, mais il récupère le texte, les images, les feuilles de style et plus encore, le tout enregistré dans son propre dossier localisé. Il peut même mettre en pause et reprendre les téléchargements.

Aspirateur de site internet :

Extraire les images

Les applications que nous venons de mentionner extraient tout d’un site particulier, y compris les images et les vidéos hébergées sur le site, mais il peut y avoir des moments où vous voulez juste prendre une image ou deux sans passer en revue une page HTML entière avec tous ses éléments.

Bien sûr, il y a l’option habituelle de clic droit et de sauvegarde, mais elle n’est pas toujours disponible : elle ne fonctionne pas pour une image cachée en arrière-plan ou intégrée à la feuille de style.

Gallerify pour Chrome est l’un des meilleurs outils que nous ayons trouvé pour cela. Cliquez sur l’icône d’extension et vous obtenez une liste de toutes les images intégrées à une page, avec les résolutions originales. En un clic, vous les téléchargez toutes ou vous pouvez les ouvrir dans des onglets séparés et les télécharger individuellement.

Du côté de Firefox, vous avez l’extension Download all images. Ouvrez une page, cliquez sur l’icône d’extension, et tout est compressé et sauvegardé sur votre disque dur dans un fichier zip. Décompressez l’archive et vous obtenez toutes les images du site, même s’il peut en oublier contrairement à Gallerify qui reconnaît les images cachées et les images de fond.

Pour Safari, il n’y a pas vraiment de téléchargeur d’images équivalent, même si Save Images travaille sur un appareil iOS. Sur Mac, le plus simple est d’installer Chrome ou Firefox pour télécharger toutes les images d’un site, et d’utiliser les extensions disponibles sur ces navigateurs.

Aspirer les vidéos et audios

Ce que ces aspirateurs ne font pas, la plupart du temps, c’est les vidéos et les audios intégrés qui sont conçus pour être visionnés en ligne et non sauvegardés sur disque (par exemple les flux YouTube et Spotify). Une grande partie de ce matériel est protégée par le droit d’auteur, vous courez donc le risque d’enfreindre les lois de votre pays si vous tentez de percer ces systèmes.

Si vous devez absolument obtenir ce contenu vidéo et audio, certaines extensions de navigateur peuvent vous aider. Chrome Audio Capture, comme son nom l’indique, capture l’audio dans n’importe quel onglet Chrome. Vous n’avez qu’à choisir votre format, puis démarrer et arrêter l’enregistrement.

Sur Firefox, Audio Downloader Prime est une extension plus sophistiquée qui permet d’identifier les éléments audio individuels d’une page. Elles les télécharge ensuite individuellement.

Pour les téléchargements vidéo, le logiciel de bureau est souvent votre meilleur choix : 4K Video Downloader fonctionne sur certains sites de streaming vidéo les plus populaires, et se décline dans une version pour Windows et MacOS. Il reste gratuit pour un usage basique.

L’extension pour Chrome IM Integration Module permet également de télécharger les vidéos qui s’affichent sur une page web.

Il existe pas mal d’autres options, mais beaucoup ne sont pas fiables ou frauduleuses : elles essayent d’installer quelque chose de plus avec le programme principal, de mettre un filigrane sur vos clips, de modifier la page d’accueil de votre navigateur ou de demander des détails personnels avant de procéder au téléchargement.

  • Rappelez-vous que des gens comme YouTube sont très désireux de s’attaquer à ces outils illicites et que les fabricants de logiciels malveillants sont très désireux d’en tirer de l’argent, alors soyez prudents quant aux logiciels que vous utilisez pour ce travail.
  • Pensez également à utiliser un VPN avant de télécharger quelque chose d’illégal sur votre ordinateur, un VPN maquillera votre adresse IP, vous rendra anonyme et chiffrera votre connexion pour éviter son piratage
  • Voir notre article sur les logiciels pour surfer anonymement
Aspirer les éléments d’un site

Utiliser HTTracks pour Windows, Linux et Android

HTTracks est un outil populaire permettant de télécharger l’ensemble des données d’un site web et d’y accéder hors ligne. Il s’agit d’un outil à source ouverte disponible pour les plateformes Windows, Linux et Android. Il permet de télécharger l’ensemble du site web en passant d’un lien à l’autre. Il est capable de formater l’archive comme si vous naviguiez sur le site web en ligne.

Bien que HTTracks soit hautement personnalisable, il dispose d’un assistant simple pour permettre aux utilisateurs novices de télécharger facilement les données du site web. Installez et lancez HTTracks, puis cliquez sur le bouton “Suivant” pour lancer l’assistant. Il vous sera demandé de donner un nom au projet que vous souhaitez créer. Ce nom vous aidera à identifier les données lorsque vous voudrez y accéder plus tard, donc assurez-vous qu’elles sont pertinentes. 

Merci de penser à noter l'article
4.92 (6 votes)

Points positifs

  • Cliquez sur le bouton “Ajouter une URL” et entrez l’URL du site web que vous souhaitez télécharger.
  • Vous pouvez ajouter plusieurs sites web si vous souhaitez télécharger les données de plusieurs sites web.
  • Il existe également un bouton “Définir les options” où vous trouverez des options de personnalisation très pratiques.

Points négatifs

  • Le processus peut prendre beaucoup de temps selon la taille du site web.
  • Les données peuvent facilement prendre des Go d’espace sur votre disque dur, alors assurez-vous d’avoir suffisamment d’espace.