Outils OSINT d'Archivage et Capture de Pages Web
Préservez les preuves numériques avant qu'elles disparaissent : archivage de pages web, capture d'écran horodatée, accès aux versions historiques de sites. Indispensables pour le journalisme d'investigation et les procédures légales.
Sous-catégories
Anna's Archive
Index de méta-recherche de livres et d'articles qui regroupe les liens de plusieurs bibliothèques fantômes.
Archive.is
Service d'instantanés Web à la demande qui préserve les copies ponctuelles des pages et raccourcit les liens d'archives.
Browsershots
Ancien service de capture d'écran multi-navigateurs historiquement utilisé pour afficher des pages dans plusieurs combinaisons navigateur/système d'exploitation.
Cached Pages
Utilitaire de recherche de cache Web qui fait apparaître les versions archivées et mises en cache d'une page cible à partir de plusieurs sources.
Cached View
Service simple de vérification du cache qui récupère des copies de pages à partir des caches des moteurs de recherche et des archives.
Common Crawl
Référentiel ouvert de données d'exploration du Web à grande échelle publiées sous forme d'ensembles de données WARC mensuels.
Internet Archive: Wayback Machine
Archive Web fournissant des instantanés historiques de sites Web capturés au fil du temps.
PDF My URL
Convertit les pages Web en captures PDF téléchargeables pour la documentation et la préservation des preuves.
Screenshots.com
Service d'archivage et de capture de captures d'écran de sites Web pour visualiser les images de pages rendues historiques ou actuelles.
Wayback Machine Chrome Extension
Extension de navigateur qui détecte les pages manquantes et charge les versions historiques à partir de Wayback Machine.
Textfiles.com
Dépôt historique préservant les premiers artefacts textuels Internet, notamment des fichiers BBS, des documents et des zines underground.
UK Web Archive
Archives dirigées par la British Library préservant une sélection de sites Web britanniques et le contenu du patrimoine Web national associé.
Waybackpack (T)
Outil de ligne de commande pour le téléchargement en masse de captures archivées à partir d'Internet Archive Wayback Machine.
Web Archive-RU
Service régional d'archivage Web axé sur la préservation et la navigation d'instantanés de sites Web sélectionnés.
WebCite
Service de préservation Web axé sur les citations avec des enregistrements archivés existants et des capacités de requête limitées.
Cryptome
Archives de divulgation de longue durée hébergeant des documents gouvernementaux, de renseignement et politiques divulgués ou difficiles à trouver.
Databases.Today
Portail de découverte de données de violation indexant les bases de données exposées et les collections d'informations d'identification divulguées.
WikiLeaks
Plateforme mondiale de publication de fuites de documents contenant des divulgations diplomatiques, militaires et d'entreprise.
Labeled Faces in the Wild DB
Ensemble de données de référence académique de photographies de visages étiquetées collectées sur le Web public.
Stanford Large Network Dataset Collection
Référentiel SNAP d'ensembles de données graphiques/réseaux couvrant les réseaux sociaux, les graphiques Web et les systèmes de communication.
UCI Spambase Data Set
Ensemble de données d'apprentissage automatique UCI classique pour la classification du spam et l'analyse des fonctionnalités de messagerie.
Visual Genome
Ensemble de données d'images structurées reliant les objets, les attributs et les relations entre graphiques de scène pour la recherche sur la compréhension visuelle.
TV Closed Caption Search
Collection Internet Archive TV News permettant de rechercher du texte sous-titré dans les enregistrements diffusés.
Waybackpy (T)
Bibliothèque Python et CLI pour interagir avec l'API de la Wayback Machine — sauvegarder pages, récupérer snapshots, lister enregistrements CDX par programmation.
Questions fréquentes — Archives OSINT
Comment archiver une page web rapidement ?
Archive.today et la Wayback Machine (web.archive.org) permettent de créer une copie permanente et horodatée de n'importe quelle page publique en quelques secondes.
Pourquoi archiver avant d'analyser ?
Les preuves numériques peuvent être supprimées en quelques minutes. Un archivage immédiat garantit la conservation de la preuve et peut être utilisé dans une procédure judiciaire.