Le framework Apache Hadoop

Architecture

 




Présentation d'une architecture distribuée dans le cadre d'Hadoop


Schéma d'architecture Hadoop représentant les principaux rôles des machines


Il faut tout d'abord savoir qu'une architecture Hadoop est basée sur les deux principaux rôles maître / esclave. Des sous-rôles relatifs au système de fichiers et à l'exécution de tâhces distribuées sont associés à chaque machine.

Dans le cadre des machines maîtres, trois principaux sous-rôles sont associés :

Les machines esclaves ont pour chacune d'elles deux sous-rôles qui leurs sont associées :

Lorsqu'un client à besoin d'accéder à une donnée ou d'exécuter une tâche distribuée, elle passe par la machine maître jouant les rôles de JobTracker et de NameNode.

Maintenant que nous avons vu globalement comment s'articule une architecture de ce type, nous allons voir les deux principaux concepts liés aux différents rôles que nous venons de présenter.