Le « dorking » ou utiliser avec efficacité les moteurs de recherche #RGPD #CNIL #DPO

 

Durant les cours sur le règlement général sur la protection des données ou sur la cyber-sécurité, la collecte d’information est primordiale. Au début on sait ce qu’on cherche alors pour trouver des informations on commence par utiliser des moteurs de recherche. 

Les stagiaires « se jettent » généralement sur le duo Chrome / Google … avec un peu de « chance » ils utilisent des moteurs différents Bing, Yahoo, Qwant, DuckDuckGo, Baidu, Yandesk ce qui permet d’obtenir des résultats différents .. et de commencer une carte mentale pour affiner et croiser les informations.



Cependant une fois les premiers résultats récupérés, il faut affiner les résultats. Les moteurs utilisent des fonctionnalités avancées que l’on peut activer mais ce n’est pas suffisant.

Les moteurs disposent de mots clef de recherche que l’on peut utiliser dans les requêtes.

Par exemple .. Bing Advanced Search OptionsBing Advanced Search Keywords ou Google Search Reference

Les Dorks permettent de trouver des informations qui n'apparaissent pas "naturellement" lors de la recherche. 

Les "dorks" peuvent être utilisés pour des usages d'informations mais également sur les actions de cybersécurité tel que constituer la cartographie des technologies utilisées; des vulnérabilités non ouvertes; des fichiers de logs; ... etc  

On trouvent facilement les clefs des dorks qui sont tel que : 

Filter

Description

Exemple

allintext

Recherche toutes les occurrences d’un mot-clé dans le corps du document (balise body).

allintext:raquette badminton

intext

Recherche les occurrences qui peuvent figurer dans le texte (balise body).

intext:chien chat cochon

inurl

Recherche une occurrence au sein d’une URL précise.

inurl:communication

allinurl

Permet d’obtenir les URLS qui contiennent le mot-clé recherché.

allinurl:documentation

intitle

Permet de récupérer les URLS qui mentionnent la requête dans le titre ou au moins un des mots-clés.

intitle:index.of finances.xls

allintitle

Recherche les occurrences dans le titre, la balise title de la page et seulement les mots-clés qui figurent dans le titre.

allintitle:”choucroute alsacienne facile”riesling

site

Limite la recherche à un site ou nom de domaine restreint. Pallie les moteurs de recherche interne médiocres.

site:www.bnf.fr

filetype

Précise le type de format de fichier sur lequel la requête doit porter.

filetype:pdf

before /after

Permet de limiter la recherche au niveau des temporalités.

filetype:pdf & (before:2018-01-01 after:2020-02-01)

allinanchor (and also inanchor)

Permet de rechercher les mots-clés qui sont sur des « ancres », c’est-à-dire des liens internes.

inanchor:OSINT

cache

Permet d’obtenir la version en cache d’un site, lorsqu’il est down ou vient d’être modifié.

cache:www.u-bordeaux-montaigne.fr

Voila vous en savez un peu plus sur le sujet à vous de creuser dans les moteurs de recherche ..

Quelques exemples .. 

L’été 2020, l’évènement marquant a été la faille qui permettait de récupérer des données notamment le numéro de téléphone de membres de groupes sur WhatsApp avec des requêtes de ce type : inurl : http://chat.whatsapp.com AND intext:”Follow this link to join my WhatsApp group”site : http://chat.whatsapp.com AND intitle:”WhatsApp Group Invite”

Les sanctions de la CNIL en 2023 intext:'sanction' and intext:'SAN-2023' site:www.legifrance.gouv.fr

Sources

https://www.cairn.info/revue-i2d-information-donnees-et-documents-2021-1-page-74.htm

https://en.wikipedia.org/wiki/Johnny_Long

https://support.google.com/websearch/answer/2466433?hl=en

https://www.exploit-db.com/google-hacking-database

https://www.bruceclay.com/blog/bing-google-advanced-search-operators/

https://en.wikipedia.org/wiki/Google_hacking

https://medium.com/codex/master-at-google-hacking-dorking-27d14e7249be

https://www.lifewire.com/bing-advanced-search-3482817

https://www.clubic.com/antivirus-securite-informatique/actualite-617326-bluetouff-3000-amende-recherche-google-anses.html

https://www.schauer.fr/wp-content/uploads/2018/01/CA-Hakin9-06-2008-googlehacking.pdf



Aucun commentaire: