Large panorama des m�thodes informatiques criminalistiques

Techniques

En raison de la richesse du sujet, nous n'aborderons que 3 techniques seulement utilis�es par l�expert dans cette partie int�ressante :

Qu'est-ce que sont ces techniques ? Nous allons le voir ci-dessous...

La st�ganographie et la st�ganalyse

La st�ganographie est une technique souvent utilis�e par les pirates pour cacher des informations illicites (mots de passe, adresses IP, num�ros de comptes bancaires vol�s, �) au sein de photographies mais pas seulement.

Steganographie cach�e

Dans cette sc�ne, un message st�ganographi� est pr�sent dans le coin en bas � gauche.

Steganographie d�voil�e

Il s'agit en effet d'une citation en braille dont la signification est la suivante : "Si un aveugle conduit un autre aveugle, ils tomberont tous les deux dans la fosse. Matthieu 15:14".

Son fonctionnement repose sur le choix d'un algorithme de chiffrement. Nous allons nous int�resser � l'exemple d�un algorithme faible :

Prendre une image
R�diger un message secret
Pour chaque bit du message secret, prendre le pixel courant de l�image et r�cup�rer le bit de poid faible
Appliquer une op�ration logique (XOR par exemple) entre les deux bits
Tant qu�il existe des bits dans le message secret, passer au bit suivant du message secret et au pixel suivant de l�image

Pour contrer la st�ganographie, la st�ganalyse proc�de � la d�tection de contenu cach�. C�est un processus qui peut �tre mis � mal assez facilement :

Une image de 640 x 480 pixels de taille 4 Mo impose une certaine m�fiance face � une image de m�me dimension dont la taille avoisine 140 Ko. La compression du contenu cach� est donc un point faible de la st�ganalyse.
La st�ganalyse n�cessite souvent d�avoir l�original de l�image pour la comparer � l�image st�ganographi�e. Cela permet d�en extraire les endroits modifi�s et de d�chiffrer plus facilement le contenu cach� (la charge utile = payload).
Le pattern de construction d�une image est d�fini. Si une image ne respecte pas ce motif, nous pouvons suspecter qu�un contenu cach� est pr�sent.

Ce proc�d� peut faire varier la teinte des pixels d�une image mais il est quasiment impossible de d�tecter � l��il nu le message dans l�image. La m�thodologie pour d�tecter l�usage de la st�ganographie dans X photos est la suivante :

R�duire manuellement le jeu de photos (copie)
Ne garder que les photos suspectes
V�rifier que les photos suspectes contiennent une charge utile
D�tecter les points de modification de chaque fichier
D�chiffrer et extraire la charge utile

La st�ganographie et la st�ganalyse sont aussi utilis�es pour extraire du contenu audio. Par exemple, il est possible d'extraire la voix d�un ravisseur lors d�une conversation t�l�phonique dans un milieu bruyant.

Les m�tadonn�es

Des m�tadonn�es peuvent �tre pr�sentes dans les fichiers, les emails, les conversations r�seaux, ... et contenir des informations souvent sous forme de donn�es brutes (paquet r�seau, musique, texte�). Tout fichier non brut dispose de m�tadonn�es (HTML, Word, MP3, �). Prenons l'exemple de la photo (libre de droits) ci-dessous :

M�tadonn�es EXIF

Rien de plus innocent � premi�re vue. Mais un petit tour sur un lecteur de m�tadonn�es EXIF comme http://regex.info/exif.cgi ou encore http://www.viewexifdata.com/index.php permet d�obtenir les informations confidentielles suivantes :

G�olocalisation / Son adresse
Nom du propri�taire de la prise photo
Nom de l�appareil ayant servi � la prise photo
Horodatages / La date de cr�ation et modification
Le type de fichier
Des commentaires

Faites vous m�me l'essai en t�l�chargeant cette image et en questionnant l'un des deux sites EXIF propos�s !

Outre les sites Web, des librairies existent en PHP, Javascript, � et des logiciels aussi pour la plus grande joie des d�veloppeurs.

La cryptographie et la cryptanalyse

Il n'est plus n�cessaire de pr�senter la cryptographie et la cryptanalyse, dont les concepts sont devenus vieux comme le monde, comme le fait de chiffrer et d�chiffrer par tous les moyens efficients possibles une information avec ou � partir d'un mot de passe.

Parfois, l'expert en informatique l�gale peut, lors d'une enqu�te, rencontrer des archives s�curis�es � acc�s restreint par un mot de passe. Dans le cadre de sa profession, le juge peut exiger d'en conna�tre la teneur. L'expert va donc soumettre l'archive a des outils qui vont tenter de casser ce mot de passe de diverses mani�res. Les m�thodes les plus classiques consistent � tester toutes les combinaisons de mots de passe (force brute), un sous-ensemble connu (dictionnaire, joker) ou, le cas �ch�ant, interroger directement le suspect et son entourage voire �tudier l'environnement du suspect pour en d�duire le mot de passe (ing�nierie sociale).

Il s'av�re que ces m�thodes ont de grossiers d�fauts :

La force brute prend un temps de calcul monstrueusement long pour les mots de passe sup�rieurs � 8 caract�res et encore plus long selon la table d'encodage (caract�res sp�ciaux, majuscules, minuscules, alphab�tique, num�rique, alphanum�rique, ...)
Les techniques par dictionnaire et joker sont simples � utiliser mais efficaces uniquement si nous savons que le mot de passe est d'usage commun ou si nous avons une portion du mot de passe. D'o� l'utilit� de s'armer de dictionnaires, des fichiers textes de mots couramment usit�s, que l'on peut trouver un peu partout sur Internet.
L'ing�nierie sociale d�pend du bon vouloir et de la na�vet� des personnes concern�es par ce mot de passe ainsi que de la pertinence de l'environnement du suspect pour sa d�duction

J'ai l'honneur de vous pr�senter une technique peu �voqu�e dans notre formation qui r�alise un bon compromis entre le temps de calcul et la quantit� de donn�es � conserver pour trouver le bon mot de passe. Il s'agit des Rainbow Tables (tables arc-en-ciel). Cette technique a �t� invent�e en 2003 par Philippe Oechslin. Elle dispose seulement d'une fonction de hachage et d'une fonction de r�duction. L'objectif consiste � pr�calculer les hashs pour obtenir les mots de passe. Elle n�cessite toutefois une grande capacit� physique de stockage car les hashs m�moris�s peuvent atteindre des Giga voire des Terra-octets de donn�es.

Cha�nes de la Rainbow Table

Comment une table arc-en-ciel fonctionne t�elle ?

Couples dans une Rainbow Table

Dans un premier temps, nous allons enregistrer disons 250 couples { mots de passe � hash } dans la table comme vous pouvez le voir ci-dessus.

Cha�ne de la Rainbow Table

Pour le mot de passe abcd, nous allons calculer son hash (fff75abc), puis le r�duire, ce qui nous donnera un second mot de passe (dsae). A celui-ci on va calculer son hash etc�

On it�re un nombre d�fini de fois jusqu�� obtenir l�empreinte 3257785a. Puis, on va enregistrer le couple { abcd, 3257785a } dans la table.

Dans un second temps, nous allons tenter de cracker un hash. Il y a trois cas de figures :

On cherche le hash 3257785a en parcourant la table depuis le d�but.

L�empreinte est pr�sente directement dans cette table mais ne correspond pas au mot de passe abcd associ� dans la cha�ne.

On va devoir reparcourir la cha�ne depuis abcd pour obtenir le mot de passe associ� qui est dqqa.
On cherche le hash ad4a4563.

Celui-ci n�existe pas dans la table. On va donc parcourir chaque cha�ne du tableau � la recherche du mot de passe correspondant � ce hash.

Il s�av�re que le hash existe d�s la premi�re cha�ne et par cons�quent nous obtenons aussi son mot de passe (qsdd)
On cherche le hash xyz12300.

Celui-ci n�existe pas dans la table. On va donc parcourir chaque cha�ne du tableau � la recherche du mot de passe correspondant � ce hash.

Nous n'avons pas pu trouver ce hash ni son mot de passe. Il est donc n�cessaire de cr�er de nouveaux couples dans la table arc-en-ciel pour avoir un panel de recherche plus grand.

Aucun syst�me n'est infaillible. C'est pour cela que je liste ci-dessous les inconv�nients majeurs de cette technique et quelques solutions pour pallier � cela :

Risques de collisions des hashs

Parfois, il se peut qu�une collision apparaisse et retourne le m�me mot de passe pour deux hashs diff�rents. Une solution pour pallier � cela est de cr�er une fonction de r�duction diff�rente par colonne de cha�ne. C�est de cette forme que l�algorithme poss�de le nom de ��tables arc-en-ciel�� ! Nous pouvons aussi �ventuellement r�duire la probabilit� de tomber sur le m�me mot de passe en salant les hashs avec une unit� de temps.

Attaque par botnet

Un botnet (r�seau de machines zombies) �quip� d�un algorithme de d�chiffrement par Rainbow Tables peut attaquer un serveur d�authentification et g�n�rer les hashs des mots de passe possibles tr�s rapidement et efficacement. D'o� l'utilit� de se prot�ger c�t� serveur par une authentification forte (double ou triple serait un plus) avec une demande de reconnexion exponentielle dans le temps (Apr�s un �chec de connexion, la tentative de reconnexion s'effectuera dans 2 secondes, puis 4, 8, 16, ...) en plus de g�rer une blacklist pour filtrer les adresses IP li�es aux attaques.

La lutte contre les intrusions dans un syst�me : les IDS

Les attaques de type intrusives sont un combat � part enti�re pour les experts en informatique l�gale. Les victimes de ce genre d'attaque sont en principe des entreprises (banque, assurance, du domaine de la d�fense et militaire), des personnes parfois influentes (politicien, diplomate, journaliste). L'attaquant s'est introduit dans leur syst�me informatique au travers d'une faille (souvent humaine, parfois organisationnelle ou technique). L'expert doit donc enqu�ter sur ces 3 cat�gories de faiblesse pour en conna�tre la source qui remet en question la solidit� des quatres r�gles fondamentales de la s�curit� des syst�mes d'information de l'entreprise victime : Disponibilit�, Int�grit�, Confidentialit�, Tra�abilit�.

Il existe bien entendu des solutions de lutte contre les intrusions (Firewall, Antivirus, r�seaux priv�s virtuels de type VPN) mais utilis�es individuellement elles ne garantissent pas une s�curit� optimale. L'int�r�t recherch� est de pouvoir d�tecter mais aussi de pr�venir les risques. C'est le r�le d'un "Intrusion Detection System" (IDS). Il peut se trouver � l'�tat mat�riel ou logiciel et effectue de la surveillance dans un r�seau (Network-based IDS) ou sur une machine pr�cise (Host-based IDS). Tout �v�nement suspect est d�tect�, signal� par une alerte, trait� et le syst�me est pr�munis contre les attaques du m�me acabit � l'avenir. L'int�r�t de cet outil est d'automatiser un travail fastidieux que ne pourrait faire l'expert seul.

Le pirate informatique peut utiliser des attaques massives (Deni de service, �ventuellement distribu�, pour saturer de requ�tes un �quipement et le rendre KO un moment, ...) ou furtives (voler des donn�es et effacer les logs serveurs pour ne pas se faire rep�rer, ...). L'expert d�tectera ais�ment avec l'IDS ad�quat la premi�re action par le flot de requ�tes simultan�es arrivant sur le serveur de l'entreprise victime. En bloquant le trafic de l'attaque, il pourra stopper l'attaque. Dans le second cas, l'expert devra �tre plus m�ticuleux car la d�tection d'une pr�sence furtive est comme la recherche dans une botte de foin. Il faut savoir o� chercher ! Certains IDS proposent de faire un hash md5 des fichiers critiques du syst�me. Ainsi, s'ils ont �t� modifi�s par un pirate, l'IDS d�tectera les diff�rences � partir des empreintes compar�es des hash entre le fichier original et le fichier courant. Puis, il signalera cela � l'expert.

J'ai rencontr� r�cemment un script PHP qui poss�dait du code obfusqu� en base64 pour rendre illisible sa compr�hension par un utilisateur n�ophyte. En r�alit�, cela ressemblait � cet exemple :

eval(gzinflate(base64_decode('aGVsbG8geW91bmcgcGFkYXdhbiwgSSdt IGEgdmlydXMgdG8gZGVzdHJveSB5b3Vy IHdlYnNpdGUuLi4=')));

Comme vous pouvez le constater, la cha�ne aGVsbG8geW91bmcgcGFkYXdhbiwgSSdt IGEgdmlydXMgdG8gZGVzdHJveSB5b3Vy IHdlYnNpdGUuLi4= est humainement illisible. Une fois ce code d�chiffr� lors de l'ex�cution du script (Vous pouvez le d�coder � l'aide de ce site), l'�valuation du contenu d�zipp� d�cod� en base 64 donnait le contenu de la charge utile de l'attaque. Dans notre exemple, nous obtenons :

echo 'hello young padawan, I'm a virus to destroy your website...';

Le script du pirate avait un r�le plus vicieux. Il chargeait des fichiers et librairies depuis un serveur pour les ex�cuter localement comme une bo�te de Pandore qui venait de s'ouvrir. Le pirate venait de transformer la machine infect�e en zombie contr�l� � distance, de mani�re ind�tectable puisque le code v�rol� en base 64 n'a pas �t� remarqu� par l'Intrusion Protection Syst�me (un IDS am�lior� et �tendu, apte � prendre des contre-mesures pour riposter � une attaque).

C'est de cette mani�re que j'ai appris comment un pirate pouvait d�jouer la d�tection d'un IPS ou d'un IDS. Il existe toutefois des solutions pour se pr�munir de ce genre d'attaques comme placer les lignes suivantes dans le fichier php.ini de votre serveur Web pour interdire l'ex�cution des fonctions PHP concern�es et des URL � distance :

allow_url_fopen = Off;
disable_functions = exec,passthru,shell_exec,system,proc_open,popen,parse_ini_file,show_source,phpinfo,proc_open,base64_decode,base64_encodem,proc_terminate;

Toutefois, lors d'une enqu�te, l'expert en informatique l�gale va dans un premier temps tenter de comprendre la situation avant de r�pliquer � l'attaque. Pour cela, une id�e est d'installer un honeypot (un pot de miel virtuel). Il s'agit d'une machine-leurre qui dispose de services et de failles bien-connues de l'expert, sur laquelle viendront s'exercer les pirates lors de leurs attaques. Comme cette machine-leurre est interfac�e en amont du syst�me d'informations de l'entreprise victime, l'expert pourra �tudier les attaques et comprendre les intentions des hackers avant qu'ils n'atteignent le coeur du syst�me d'informations.

Il reste n�anmoins qu'aucun syst�me n'est infaillible. C'est pour cela qu'il faut r�guli�rement mettre � jour ses logiciels et �quipements, se former aux nouvelles technologies et s'informer des techniques et des failles r�centes. C'est ce que l'expert en informatique l�gale s'est engag� � faire pour respecter sa mission.

Bienvenue

Informatique criminalistique

L'expert en informatique l�gale

Outils et m�thodologies informatiques

Techniques

Finalit� de la pr�sentation

R�f�rences

Large panorama des m�thodes informatiques criminalistiques

Techniques

La st�ganographie et la st�ganalyse

Les m�tadonn�es

La cryptographie et la cryptanalyse

La lutte contre les intrusions dans un syst�me : les IDS