Durant les cours sur le règlement général sur la protection des données ou sur la cyber-sécurité, la collecte d’information est primordiale. Au début on sait ce qu’on cherche alors pour trouver des informations on commence par utiliser des moteurs de recherche.
Les stagiaires « se
jettent » généralement sur le duo Chrome / Google … avec un peu de « chance » ils utilisent des moteurs différents Bing, Yahoo, Qwant, DuckDuckGo,
Baidu, Yandesk ce qui permet d’obtenir des résultats différents .. et de
commencer une carte mentale pour affiner et croiser les informations.
Cependant une fois les premiers
résultats récupérés, il faut affiner les résultats. Les moteurs utilisent des
fonctionnalités avancées que l’on peut activer mais ce n’est pas suffisant.
Les moteurs disposent de mots clef de recherche que l’on peut utiliser dans les requêtes.
Par exemple .. Bing Advanced Search Options, Bing Advanced Search Keywords ou Google Search Reference
Les Dorks permettent de trouver des informations qui n'apparaissent pas "naturellement" lors de la recherche.
Les "dorks" peuvent être utilisés pour des usages d'informations mais également sur les actions de cybersécurité tel que constituer la cartographie des technologies utilisées; des vulnérabilités non ouvertes; des fichiers de logs; ... etc
On trouvent facilement les clefs des dorks qui sont tel que :
Filter
Description
Exemple
allintext |
Recherche
toutes les occurrences d’un mot-clé dans le corps du document (balise body). |
allintext:raquette
badminton |
intext |
Recherche
les occurrences qui peuvent figurer dans le texte (balise body). |
intext:chien
chat cochon |
inurl |
Recherche
une occurrence au sein d’une URL précise. |
inurl:communication |
allinurl |
Permet
d’obtenir les URLS qui contiennent le mot-clé recherché. |
allinurl:documentation |
intitle |
Permet de
récupérer les URLS qui mentionnent la requête dans le titre ou au moins un
des mots-clés. |
intitle:index.of
finances.xls |
allintitle |
Recherche
les occurrences dans le titre, la balise title de la page et seulement les
mots-clés qui figurent dans le titre. |
allintitle:”choucroute
alsacienne facile”riesling |
site |
Limite la
recherche à un site ou nom de domaine restreint. Pallie les moteurs de
recherche interne médiocres. |
site:www.bnf.fr |
filetype |
Précise le
type de format de fichier sur lequel la requête doit porter. |
filetype:pdf |
before
/after |
Permet de
limiter la recherche au niveau des temporalités. |
filetype:pdf
& (before:2018-01-01 after:2020-02-01) |
allinanchor
(and also inanchor) |
Permet de
rechercher les mots-clés qui sont sur des « ancres », c’est-à-dire
des liens internes. |
inanchor:OSINT |
cache |
Permet
d’obtenir la version en cache d’un site, lorsqu’il est down ou vient d’être
modifié. |
cache:www.u-bordeaux-montaigne.fr |
Voila vous en savez un peu plus sur le sujet à vous de creuser dans les moteurs de recherche ..
Quelques exemples ..
L’été 2020, l’évènement marquant a été la faille qui permettait de récupérer des données notamment le numéro de téléphone de membres de groupes sur WhatsApp avec des requêtes de ce type : inurl : http://chat.whatsapp.com AND intext:”Follow this link to join my WhatsApp group”site : http://chat.whatsapp.com AND intitle:”WhatsApp Group Invite”
Les sanctions de la CNIL en 2023 intext:'sanction' and intext:'SAN-2023' site:www.legifrance.gouv.fr
Sources
https://www.cairn.info/revue-i2d-information-donnees-et-documents-2021-1-page-74.htm
https://en.wikipedia.org/wiki/Johnny_Long
https://support.google.com/websearch/answer/2466433?hl=en
https://www.exploit-db.com/google-hacking-database
https://www.bruceclay.com/blog/bing-google-advanced-search-operators/
https://en.wikipedia.org/wiki/Google_hacking
https://medium.com/codex/master-at-google-hacking-dorking-27d14e7249be
https://www.lifewire.com/bing-advanced-search-3482817
https://www.schauer.fr/wp-content/uploads/2018/01/CA-Hakin9-06-2008-googlehacking.pdf
Aucun commentaire:
Enregistrer un commentaire