Moteurs de Recherche OSINT et Google Dorks
Maîtrisez les opérateurs de recherche avancés (Google Dorks), les moteurs alternatifs et les outils de recherche spécialisés pour trouver des informations cachées dans les profondeurs du web indexé.
Sous-catégories
Le moteur de recherche le plus populaire au monde avec des capacités d'indexation avancées et la prise en charge d'opérateurs de recherche étendus (Google dorks). Utilisé pour la recherche OSINT passive avec une large couverture Web.
Bing
Le moteur de recherche de Microsoft avec des opérateurs de recherche avancés et des capacités API. Prend en charge bon nombre des mêmes opérateurs que Google, offrant une couverture de recherche alternative.
DuckDuckGo
Moteur de recherche axé sur la confidentialité qui ne suit pas les utilisateurs et ne stocke pas de données personnelles. Traite environ 3 milliards de requêtes par mois avec des protections de confidentialité améliorées et un blocage des trackers.
Yahoo Advanced Web Search
Interface de recherche avancée de Yahoo avec prise en charge des opérateurs de recherche, notamment site :, intitle :, filetype :, AND, OR, NOT. Fournit des données de résultats de recherche en temps réel avec filtrage de localisation.
StartPage
Moteur de recherche proxy axé sur la confidentialité qui supprime les données d'identification avant d'interroger Google/Bing et fournit une vue anonyme des sites Web visités via des serveurs proxy.
Yandex
Moteur de recherche russe avec une excellente couverture des espaces numériques post-soviétiques. Prend en charge plus de 20 opérateurs avancés et fournit une indexation plus rapide des forums russes et des tableaux de violations que Google.
Baidu
Le moteur de recherche dominant en Chine avec prise en charge des opérateurs de recherche avancés et des données de graphes de connaissances. Utilisé pour la recherche sur la langue chinoise et l'OSINT régional.
Google Advanced Search
Interface dédiée aux opérateurs de recherche avancée de Google. Facilite la construction de requêtes complexes sans mémoriser la syntaxe idiote grâce à une interface visuelle basée sur un formulaire.
iZito
Moteur de métarecherche regroupant les résultats provenant de plusieurs sources, notamment Wikipédia, des vidéos, des actualités et des produits. Conçu pour prendre en charge un comportement de recherche non linéaire avec un affichage multi-colonnes.
Advangle
Générateur de requêtes de recherche avancées pour Google et Bing. Permet la construction de requêtes de recherche multi-paramètres complexes sans mémoriser la syntaxe des opérateurs.
Instya
Moteur de recherche de produits de commerce électronique et plateforme de découverte d'achats. NE convient PAS à la recherche générale sur le Web OSINT - inadéquation des catégories avec les moteurs de recherche.
Hulbee
Site d'entreprise et page produit de Hulbee AG. PAS un moteur de recherche en soi - Hulbee est la société derrière Swisscows. Problème de non-concordance URL/catégorie.
Mojeek
Moteur de recherche indépendant basé au Royaume-Uni avec son propre robot d'exploration et son propre index. Axé sur la confidentialité, sans suivi des utilisateurs depuis 2006. Prend en charge les opérateurs de recherche avancés.
Swisscows
Moteur de recherche suisse axé sur la confidentialité utilisant l'IA sémantique. Stocke toutes les données dans les installations des Alpes suisses. Pas de cookies, pas de suivi, pas de profils d'utilisateurs. Comprend un filtrage familial.
Brave
Moteur de recherche axé sur la confidentialité avec index indépendant. Propose des lunettes pour un classement personnalisé des résultats de recherche. Première API de recherche avec option de rétention de données nulle.
Stract
Moteur de recherche open source créé par des développeurs pour des développeurs. Comprend des optiques personnalisables pour le filtrage et le classement des résultats. Index indépendant avec robot d'exploration Web.
iSEEK
Métamoteur de recherche qui regroupe les résultats de plusieurs sources. Service hors ligne : l'URL renvoie une erreur 404. N'est plus opérationnel.
eTools.ch
Métamoteur de recherche suisse axé sur la confidentialité agrégeant simultanément plus de 14 sources (Google, Bing, Brave, DuckDuckGo, Yandex, etc.). Résultats rapides en moyenne de 0,83 seconde.
PublicWWW
Moteur de recherche de code source pour HTML, JavaScript, CSS et texte brut sur plus de 509 millions de pages Web. Recherchez des sites Web à l'aide d'identifiants d'analyse spécifiques, de comptes publicitaires ou d'extraits de code.
Searchcode
Moteur de recherche de code qui indexe le code source public de GitHub, GitLab, Bitbucket et d'autres référentiels ; utile pour trouver des exemples de code et identifier les modèles d’utilisation de la technologie.
NerdyData
Moteur de recherche de code source pour la reconnaissance de la technologie des sites Web qui indexe HTML, CSS et JavaScript sur des millions de sites Web en direct afin d'identifier l'utilisation de la technologie et de la bibliothèque.
Gitrob (T)
Outil CLI pour la reconnaissance des organisations et des utilisateurs GitHub ; clone les référentiels et analyse l'historique des validations à la recherche de fichiers sensibles, d'informations d'identification exposées et de données de configuration.
Github-Dorks (T)
Collection d'opérateurs de recherche avancée GitHub et d'un outil CLI qui automatise la recherche sur GitHub des informations d'identification exposées, des clés API, des fichiers de configuration et d'autres informations sensibles.
GitLeaks
Outil SAST open source pour détecter les secrets codés en dur, les clés API, les mots de passe et les informations d'identification dans les référentiels git et les systèmes de fichiers à l'aide de règles de détection personnalisables basées sur les expressions régulières.
GlobalFile
Moteur de recherche de fichiers FTP qui indexe les serveurs FTP accessibles au public ; permet de rechercher des types de fichiers spécifiques, notamment des images, des vidéos, des logiciels et des archives.
FTP Google Dork (D)
Technique Google dork utilisant les opérateurs inurl:ftp pour découvrir les répertoires et fichiers du serveur FTP indexés publiquement via l'index Web de Google.
Napalm FTP
Indexeur FTP et moteur de recherche avec plus de 329 millions de fichiers indexés sur plus de 1 200 serveurs FTP ; prend en charge le filtrage avancé par type de fichier, taille et emplacement du serveur.
PubPeer
Plateforme d'examen par les pairs post-publication où les chercheurs commentent et signalent les problèmes liés aux articles scientifiques publiés ; utile pour identifier les recherches rétractées ou problématiques.
Bielefeld Academic Search Engine
Moteur de recherche universitaire indexant plus de 400 millions de documents provenant de plus de 12 000 fournisseurs de contenu, notamment des référentiels institutionnels, des revues en libre accès et des bases de données de recherche dans le monde entier.
Google Scholar
Moteur de recherche universitaire multidisciplinaire indexant des articles de revues, des thèses, des livres, des documents de conférence et des brevets ; comprend le nombre de citations et la découverte de travaux connexes.
PubMed - National Center for Biotechnology Information
Base de données gratuite de littérature biomédicale et des sciences de la vie maintenue par le NCBI avec plus de 40 millions de citations ; comprend des résumés et des liens vers des articles en texte intégral.
Open Library
le catalogue ouvert d'Internet Archive de plus de 3 millions de livres avec des éditions numériques empruntables ; fournit des données bibliographiques et un accès au texte intégral pour de nombreux titres épuisés.
JURN
Moteur de recherche multidisciplinaire indexant des articles académiques librement accessibles ; couvre les arts, les sciences humaines, l'écologie et les sciences sociales en mettant l'accent sur le contenu en libre accès.
UK National Archives
Catalogue en ligne officiel des Archives nationales du Royaume-Uni donnant accès à plus de 32 millions de documents couvrant 1 000 ans de documents gouvernementaux, juridiques et historiques britanniques.
OpenGrey EU Papers
Ancienne base de données de littérature grise européenne maintenue par l'INIST-CNRS qui indexait les documents scientifiques et techniques non conventionnels ; archivé en 2020 et n'est plus mis à jour.
US Gov Publishing Office - FDsys
L'ancien système documentaire du US Government Publishing Office (FDsys) qui a été remplacé par GovInfo (govinfo.gov) ; l'URL redirige désormais vers la plateforme GovInfo modernisée.
OpenDOAR
Répertoire mondial de référentiels en libre accès avec plus de 6 000 référentiels universitaires provenant de plus de 130 pays ; utile pour localiser les dépôts institutionnels et les archives spécifiques à une discipline.
Microsoft Academic
Le service de recherche universitaire de Microsoft indexant des centaines de millions d'articles de recherche ; notez que le service Microsoft Academic d'origine a été interrompu en décembre 2021 et cette URL peut rediriger.
Science Direct
la plateforme Elsevier de littérature scientifique évaluée par des pairs avec accès à plus de 2 900 revues et 30 000 livres électroniques ; librement consultable avec accès au texte intégral nécessitant un abonnement ou un accès institutionnel.
Think Tank Search
Guide de la bibliothèque de la Harvard Kennedy School pour la recherche de rapports de recherche et de politiques de groupes de réflexion ; le service Think Tank Search référencé est obsolète en février 2025.
Library Databases
Répertoire de bases de données A-Z de la bibliothèque de l'Université de Floride, donnant accès à des centaines de bases de données universitaires couvrant toutes les disciplines ; utile comme référence pour localiser des bases de données de recherche spécialisées.
Copyscape Plagiarism Checker
Service de détection de plagiat en ligne qui recherche sur le Web des copies du texte ou des URL soumis ; utile pour vérifier l’originalité du contenu ou retrouver l’endroit où le texte a été republié.
Lazy Scholar (T)
Extension de navigateur qui recherche automatiquement les versions juridiques intégrales gratuites des articles universitaires lors de la visualisation de contenu payant ; vérifie les référentiels en libre accès et PubMed Central.
Open Access Scholarly Journals
PAGEPress, éditeur en libre accès hébergeant des revues à comité de lecture dans les domaines des sciences biomédicales, naturelles et sociales ; offre un accès gratuit aux articles de recherche publiés.
The Open Syllabus Project
Plateforme analytique cartographiant les syllabi académiques pour révéler les textes les plus assignés dans les universités du monde.
Science Publications
Moteur de recherche de publications scientifiques en accès ouvert couvrant de multiples disciplines et journaux.
arXiv.org
Dépôt de prépublications en accès ouvert avec 2,3 millions d'articles en physique, mathématiques, informatique, économie et biologie.
Google News Search
Recherche avancée Google Actualités avec filtres par date, source, région et sujet.
Plateforme d'agrégation et curation d'actualités collectant articles de médias, blogs et réseaux sociaux en magazines thématiques.
YouGotTheNews
Moteur de recherche d'actualités agrégant titres de grandes sources et agences de presse.
NewspaperARCHIVE.com
Archive historique de journaux avec plus de 20 milliards d'articles issus de 25 000+ publications couvrant 300+ ans de presse.
PressReader.com
Kiosque numérique avec accès à 7 000+ journaux et magazines de 100+ pays dans leur mise en page originale.
Newspaper Map
Carte mondiale interactive des sites de journaux, filtrable par langue et pays.
NewsBrief
NewsBrief du Moniteur Européen des Médias en 50+ langues, agrégeant et regroupant les dernières actualités de milliers de sources.
AllYouCanRead.com
Annuaire de 22 000+ journaux, magazines et sites d'actualité organisés par pays et catégorie.
World News
Agrégateur d'actualités mondiales multilingue recherchant dans des milliers de sources internationales.
NewsNow.co.uk
Agrégateur d'actualités britanniques en temps réel surveillant des milliers de sources et se mettant à jour toutes les cinq minutes.
Hubii
Plateforme d'agrégation et distribution de contenus médias pour éditeurs et diffuseurs.
Inshorts
Application d'actualités livrant des résumés de 60 mots sur les principales informations indiennes et internationales.
NewsBot
Bot d'agrégation automatique d'actualités collectant et faisant remonter les sujets tendance depuis plusieurs sources.
Colossus International Engine List
Annuaire de 3 000+ moteurs de recherche internationaux organisés par pays, région et sujet, y compris des moteurs locaux obscurs.
Zenodo
Dépôt de recherche ouvert opéré par le CERN hébergeant 3M+ jeux de données, articles, logiciels et données de publications.
EntityCube
Moteur de résumé de personnes et entités de Microsoft Research agrégeant informations sur des individus notables depuis le web.
FindTheData A Research Engine
Moteur de recherche de données et statistiques comparatives sur écoles, entreprises, politiciens et personnalités.
wayparam
Outil CLI extrayant paramètres d'URL depuis l'API CDX de la Wayback Machine pour découvrir endpoints cachés dans archives web.
SearchDiggity (T)
SearchDiggity de Bishop Fox est une interface Windows automatisant les requêtes Google Hacking (Google Dorks) sur domaines et infrastructures cibles.
Scanner-inurlbr (T)
Scanner web Python avancé automatisant requêtes Google/Bing dorks pour trouver cibles vulnérables, identifiants exposés et fichiers sensibles.
Google Alerts
Service gratuit de surveillance Google envoyant des alertes e-mail quand de nouveaux résultats correspondant à un mot-clé apparaissent dans l'index Google.
Google Custom Search Engine
Moteur de recherche programmable Google permettant de créer une interface de recherche ciblée sur des domaines spécifiques.
pagodo - Passive Google Dork (T)
Outil Python CLI qui automatise les recherches passives de Google Dork à l'aide de la base de données de piratage Google (GHDB), prenant en charge les proxys HTTP/SOCKS5 pour éviter la limitation de débit.
dorksearch.com
Outil de création et de recherche Google dork basé sur le Web qui s'intègre à Shodan, Censys et GitHub pour des recherches OSINT complètes.
dorkgenerator.pages.dev
Générateur dork en ligne pour créer des requêtes de paramètres de recherche Google personnalisées pour faciliter la recherche OSINT et de sécurité.
dorksearch.netlify.app
Interface Web légère pour créer et exécuter des recherches Google Dork avec un minimum de dépendances.
Google Hacking Database
Base de données organisée par Offensive Security de requêtes Google dork, organisées par catégorie, utilisée pour trouver des informations sensibles exposées sur le Web.
Google Search Operators Guide
Documentation officielle de Google couvrant tous les opérateurs de recherche, la syntaxe et les techniques de recherche avancées pris en charge.
Google Guide Cheat Sheet
Aide-mémoire de référence rapide pour les opérateurs de recherche Google et syntaxe de recherche avancée du Guide Google.
TruffleHog (T)
Scanner de secrets open source détectant 700+ types de clés API, tokens et identifiants dans dépôts git, buckets S3, Jira et systèmes de fichiers.
Questions fréquentes — Search Engines OSINT
Qu'est-ce qu'un Google Dork ?
Un Google Dork est une requête de recherche avancée utilisant des opérateurs spéciaux (site:, filetype:, inurl:, intitle:) pour trouver des informations précises qu'une recherche normale ne retournerait pas.
Quels opérateurs Google sont utiles en OSINT ?
site: (restreindre à un domaine), filetype:pdf (type de fichier), inurl: (mot dans l'URL), intitle: (dans le titre), "" (phrase exacte), - (exclure un mot), cache: (voir une ancienne version).