Télécharger et aspirer les éléments d’un site avec des outils gratuits

Voici les outils gratuits pour aspirer un site web ou télécharger tous ses éléments un à un.

Internet est toujours accessible, où que vous soyez… jusqu’à ce que vous ne le captiez plus.

  • Peut-être que vous avez un long vol à faire et que vous avez besoin d’un peu de lecture
  • peut-être que vous voulez juste sauvegarder un site web pour le garder en lieu sûr

Quelle que soit votre raison, voici comment vous pouvez télécharger à peu près tout ce que vous rencontrez sur internet avec des outils uniquement gratuits.

Pour enregistrer rapidement une page Web

Vous ne le savez peut-être pas, mais votre navigateur internet peut enregistrer des pages Web et d’autres éléments.

Dans Chrome

  • Cliquez avec le bouton droit de la souris sur n’importe quelle page
  • Choisissez Enregistrer sous pour enregistrer la page Web sur votre disque dur
  • Vous obtiendrez tout le texte et la plupart des images, mais pas de médias intégrés comme les vidéos

Le processus est similaire avec Firefox

  • Cliquez à nouveau sur le bouton droit de la souris sur une zone vide de la page
  • Choisissez Enregistrer sous dans le menu qui s’affiche
  • Donnez un nom à votre page

En dehors des vidéos en streaming, de l’audio ou des éléments interactifs compliqués, vous devriez avoir un rendu fac-similé de cette page web sur votre système local.

Dans Safari

  • Ouvrez une page
  • Choisissez Fichier et Enregistrer sous
  • Donnez un nom à votre nouveau fichier
  • Assurez-vous que le format « Web Archive » est sélectionné
  • Et vous avez une copie conforme du site sur lequel vous étiez

Attention : même les publicités et les codes JavaScript sont copiés, vous aurez une copie conforme du site hors-ligne. Par contre, les médias intégrés sont là aussi oubliés.

Ces outils de sauvegarde sont pratiques mais pas très complets : ils ont été conçus à une époque plus simple où les pages Web étaient statiques, comme des blocs simples de textes et d’images affichés dans le navigateur.

L’option est pratique, mais vous remarquerez sûrement des éléments manquants en utilisant cette méthode.

A noter

Le fichier enregistré sera au format .html.

  • Vous pouvez ouvrir et modifier les fichiers HTML avec divers éditeurs de code source et applications de développement Web.
  • Microsoft Visual Studio Code (multiplateforme) est un éditeur de code source utile
  • Adobe Dreamweaver (multiplateforme) est une application de développement Web populaire.
  • Le langage HTML étant enregistré en texte brut, vous pouvez également ouvrir et modifier les fichiers HTML avec un éditeur de texte de base, tel que Microsoft Notepad (Windows)
  • ou Apple TextEdit (Mac), même si ces éditeurs de texte ne disposent pas des fonctionnalités incluses dans les éditeurs de code source et les applications de développement Web qui facilitent le travail des développeurs.
  • Vous pouvez prévisualiser une page Web HTML en l’ouvrant avec un navigateur Web, tel que Google Chrome (multiplateforme), Microsoft Edge (multiplateforme), Mozilla Firefox (multiplateforme) ou Apple Safari (Mac et iOS).

Pour sauvegarder une page Web avec ses compléments

Les services de lecture hors-ligne

Quelques services permettent d’obtenir des copies de pages web même en étant hors-ligne :

Ils vous donneront des pages Web sous une forme simplifiée, mais n’aspirent pas une page dans son intégralité.

Les aspirateurs de sites web

L’un des outils les plus anciens et les plus connus pour un travail d’aspiration complet est HTTrack pour Windows, qui crée plus ou moins le cache complet d’un site sur votre disque local.

C’est comme si vous consultiez le site lui-même, mais tout en étant hors ligne :

  • y compris les images
  • les polices
  • et les liens vers les pages du même domaine

Vos téléchargements peuvent être catégorisés et couvrir plusieurs URL à l’intérieur d’un même projet.

Une autre option est Cyotek WebCopy, toujours pour Windows

Son fonctionnement est très similaire, rampant autour d’un site et téléchargeant absolument tout ce qui s’y trouve, y compris les images et les vidéos (tant qu’elles sont hébergées sur le site et qu’elles ne sont pas diffusées en continu depuis un autre endroit).

C’est encore plus complet et convivial que HTTrack, mais ils valent tous les deux la peine d’être découverts.

Si vous êtes du côté de macOS, essayez SiteSucker

Il vous coûtera 5 euros, mais il récupère :

  • le texte
  • les images
  • les feuilles de style et plus encore
  • le tout enregistré dans son propre dossier localisé

Il peut même mettre en pause et reprendre les téléchargements.

Aspirateur de site internet SiteSucker :

 

Extraire les images

Les applications que nous venons de mentionner extraient tout d’un site particulier, y compris les images et les vidéos hébergées sur le site, mais il peut y avoir des moments où vous voulez juste prendre une image ou deux sans passer en revue une page HTML entière avec tous ses éléments.

Bien sûr, il y a l’option habituelle de clic droit et de sauvegarde, mais elle n’est pas toujours disponible : elle ne fonctionne pas pour une image cachée en arrière-plan ou intégrée à la feuille de style.

Image Downloader est l’un des meilleurs outils que nous ayons trouvé pour cela

Cliquez sur l’icône d’extension et vous obtenez une liste de toutes les images intégrées à une page, avec les résolutions originales.

En un clic, vous les téléchargez toutes ou vous pouvez les ouvrir dans des onglets séparés et les télécharger individuellement.

Du côté de Firefox, vous avez l’extension Download all images

  1. Ouvrez une page
  2. Cliquez sur l’icône d’extension
  3. Tout est compressé et sauvegardé sur votre disque dur dans un fichier zip

Décompressez l’archive et vous obtenez toutes les images du site, même s’il peut en oublier contrairement à Gallerify qui reconnaît les images cachées et les images de fond.

Pour Safari, il n’y a pas vraiment de téléchargeur d’images équivalent

…même si Save Images travaille sur un appareil iOS (le soft date de 2014).

Sur Mac, le plus simple est d’installer Chrome ou Firefox pour télécharger toutes les images d’un site, et d’utiliser les extensions disponibles sur ces navigateurs.

Aspirer les vidéos et audios

Ce que ces aspirateurs ne font pas, la plupart du temps, c’est les vidéos et les audios intégrés qui sont conçus pour être visionnés en ligne et non sauvegardés sur disque (par exemple les flux YouTube et Spotify).

Une grande partie de ce matériel est protégée par le droit d’auteur, vous courez donc le risque d’enfreindre les lois de votre pays si vous tentez de percer ces systèmes.

Si vous devez absolument obtenir ce contenu vidéo et audio, certaines extensions de navigateur peuvent vous aider.

  • Chrome Audio Capture, comme son nom l’indique, capture l’audio dans n’importe quel onglet Chrome. Vous n’avez qu’à choisir votre format, puis démarrer et arrêter l’enregistrement.
  • Sur Firefox, Audio Downloader Prime est une extension plus sophistiquée qui permet d’identifier les éléments audio individuels d’une page. Elles les télécharge ensuite individuellement.

Pour les téléchargements vidéo, le logiciel de bureau est souvent votre meilleur choix

  • 4K Video Downloader fonctionne sur certains sites de streaming vidéo les plus populaires, et se décline dans une version pour Windows et MacOS. Il reste gratuit pour un usage basique.
  • L’extension pour Chrome IM Integration Module permet également de télécharger les vidéos qui s’affichent sur une page web.

Il existe pas mal d’autres options, mais beaucoup ne sont pas fiables ou frauduleuses :

  • elles essayent d’installer quelque chose de plus avec le programme principal
  • de mettre un filigrane sur vos clips
  • de modifier la page d’accueil de votre navigateur
  • ou de demander des détails personnels avant de procéder au téléchargement
  • Rappelez-vous que des gens comme YouTube sont très désireux de s’attaquer à ces outils illicites et que les fabricants de logiciels malveillants sont très désireux d’en tirer de l’argent, alors soyez prudents quant aux logiciels que vous utilisez pour ce travail.
  • Pensez également à utiliser un VPN avant de télécharger quelque chose d’illégal sur votre ordinateur, un VPN maquillera votre adresse IP, vous rendra anonyme et chiffrera votre connexion pour éviter son piratage

 A noter

Un VPN, ou réseau privé virtuel, chiffre tout le trafic internet d’un appareil et l’achemine ensuite par un serveur intermédiaire situé à l’endroit choisi par l’utilisateur.
Le résultat final est que l’adresse IP de l’appareil est masquée et que des tiers (y compris les fournisseurs d’accès) ne peuvent pas surveiller le trafic. Personnellement nous utilisons NordVPN parce qu’il est no-log (sans enregistrer aucun historique).
Utiliser HTTrack pour Windows, Linux et Android

Aspirer les éléments d’un site

Pour activer le mode hors ligne dans Chrome et Firefox, Chrome et Firefox sont dotés d’un mode qui vous permet de charger une page à partir du cache du navigateur au cas où vous n’auriez pas de connexion internet.

Lorsque vous activez ce mode, le navigateur vous donne la possibilité de charger des pages web à partir du cache. Vous pouvez donc accéder à n’importe quelle page web hors ligne à laquelle vous avez accédé auparavant.

Activer le mode hors ligne dans Chrome :

  • Dans Chrome, tapez chrome://flags
  • Recherchez un drapeau nommé « Show Saved Copy Button »
  • Cliquez sur le menu déroulant situé en dessous et sélectionnez « Activer : Primaire »
  • Redémarrez le navigateur pour que les changements prennent effet.

Chaque fois que vous visiterez une page hors ligne que vous avez déjà visitée, vous verrez le bouton « Afficher la copie enregistrée » . Cliquez dessus pour charger la page web hors ligne.

Activer le mode hors ligne dans Firefox :

  • Dans Firefox, cliquez sur le menu « hamburger » en haut à droite
  • Cliquez sur l’option « Developer »
  • Une liste s’affichera, dans laquelle il faudra cliquer sur l’option « Travailler hors ligne » pour l’activer

Désormais, même si vous disposez d’une connexion internet, Firefox sera hors ligne et vous ne pourrez accéder qu’aux sites web qui sont déjà en cache.

Quelle note attribuez-vous sur un total de 5 ?
4.52 (26 votes)
Un commentaire sur “Télécharger et aspirer les éléments d’un site avec des outils gratuits”
  • Bonjour, je cherche à faire un truc différent de ce qui est énoncé au-dessus. Une page web avec un champ de formulaire, renvoi une liste de résultat suivant ce qu’on a mis dans le champ (un code postal). Est-il possible de récupérer l’ensemble des résultats possibles en rejouant le même scenario pour une liste de codes postaux.

    C’est une base de données publique qui n’est pas téléchargeables (sur ce que j’ai pu avoir comme information jusqu’à maintenant…) et qui ne propose pas non plus d’API.