Infrastructure d'un datacentre et relocalisation

Phase d'étude

Les sujets à aborder

La conception d'un datacentre se fait au travers d'une phase d'étude longue et complexe. Elle s'étend sur plusieurs années (deux à trois généralement). Lors de cette phase, de nombreux sujets sont étudiés et sont confrontés aux besoins de l'entreprise et à l'état de l'art. La liste suivante présentes les principaux sujets abordés lors d'une phase d'étude:

L'objectif ici n'est pas de s'intéresser à l'ensemble de ces sujets. Seuls ceux permettant de bien rendre compte de la logique interne d'un datacentre et de son infrastructure seront abordés.

Le bâtiment

Bien qu'il héberge plusieurs équipements et fournisse différents services à une entreprise, un datacentre est avant tout un bâtiment. Il est conçu et réfléchi pour fournir une certaine facilité d'accès et pour héberger l'ensemble des équipements informatiques prévus. Il doit aussi répondre à l'ensemble des normes applicables et à des consignes de sécurité strictes.

Lors de la phase d'étude de conception du bâtiment, certaines questions importantes doivent être résolues pour permettre l'avancée du projet:

image de racks alignés
Image de racks alignés

Une fois l'ensemble de ces points déterminés lors de l'étude, il est alors possible de dessiner les plans finaux des salles informatiques et du bâtiment.

schéma de salle informatique
Schéma de salle informatique. Chaque colonne représente une rangée de racks et un carré représente un rack. Les carrés rouges et bleus-ciel sont des racks réseau et contienne des commutateurs.

Les équipements informatiques

Les salles informatiques contiennent une multitude d'équipements informatiques rangés dans des racks. Pour rappel, on peut trouver entre autres:

Lors de la phase de conception, il n'est pas possible de quantifier exactement le nombre d'équipements informatiques nécessaires. Cela doit être calculé en fonction du nombre d'applications à héberger et exécuter, de la puissance nécessaire ou encore du nombre de rangées disponibles. L'objectif est surtout de fournir un premier nombre d'équipements suffisamment important lors de l'ouverture du datacentre pour supporter l'activité.

Le refroidissement

Le refroidissement des datacentres est un élément crucial. Des équipements informatiques mal refroidis surchauffent et tombent souvent en panne. Un bon refroidissement impacte donc directement les performances d'un datacentre.

Il existe deux méthodes principales de refroidissement:

Généralement, l'air-cooling est plus sollicité car il est moins cher à mettre en place. Cependant, le water cooling revient peu à peu car il est plus performant.

On peut aussi compter des solutions plus innovantes, plus respectueuses de l'environnement et plus économiques:

Le câblage des équipements

Le câblage des équipements informatiques est un point crucial dans l'infrastructure d'un datacentre. Lorsqu'il est bien réalisé, il permet de faciliter l'administration et l'ajout (ou le retrait) d'équipements et de ne pas obstruer le flux d'air.

illustration d'un mauvais cabling
Illustration d'un mauvais cabling. Ici, les ventilations sont totalement obstruées.

Le câblage permet de relier les équipements entre eux et avec le "monde extérieur". Il existe quelques bonnes pratiques permettant de câbler efficacement une salle.

Dans une salle informatique, on compte trois zones principales de câblage:

répartition des zones de câblage dans une salle informatique
Répartition des zones de câblage dans une salle informatique.

De nombreux câbles sont utilisés pour relier l'ensemble de ces zones. Afin d'assurer la sécurité du personnel et pour que les câbles de soient pas accidentellement sectionnés, il faut prévoir plusieurs passages réservés aux câbles. C'est pourquoi l'ensemble de ces câbles sont positionnés dans des chemins de câbles attachés au plafond ou sous le faux-plancher.

illustration des chemins de câbles au plafond
Illustration des chemins de câbles au plafond. Ils circulent à l'intérieur des gouttières jaunes.

Détail des chemins de câbles au niveau du plafond
Détail des chemins de câbles au niveau du plafond.

Les infrastructures LAN et SAN

Les infrastructures LAN et SAN correspondent aux interconnexions de serveurs et baies de stockage. Le réseau LAN est responsable des communications serveur à serveur. Le réseau SAN quant à lui représente un réseau de baies de stockage. Il est nécessaire d'interconnecter ces deux types de réseaux pour permettre les communications serveurs à baies de stockage.

Pour cela, les communications vont reposer sur l'utilisation de deux protocoles:

Pour assurer les communications, il faut donc utiliser des switchs capables de gérer ces protocoles. On utilise donc des switchs Ethernet pour le LAN et des switchs Fibre Channel pour la partie SAN. Les serveurs sont capables de se connecter aux switchs Ethernet pour la communication serveur à serveur et sur des switchs Fibre Channel pour communiquer avec les baies de stockage.

schéma d'infrastructures LAN et SAN
Schéma d'infrastructures LAN et SAN. La partie bleue représente le réseau LAN et la partie noire le réseau SAN. Les routeurs correspondent à la partie MDA ou cœ“ur de réseau. Sous ces routeurs, on trouve les switchs Ethernet interconnectant les serveurs (carrés gris). Les serveurs sont ensuite connectés au réseau SAN grâce aux switchs Fibre Channel.

Le plan de reprise d'activité

Le plan de reprise d'activité (ou PRA) permet à une entreprise d'assurer son activité en cas de crise. Cette continuité est possible en reconstruisant rapidement le système détérioré lors de la crise. Les PRA les plus évolués reposent aussi sur une bascule temporaire sur un système de relève. Par exemple, un datacentre victime d'un incendie verra son activité basculer vers un autre datacentre de l'entreprise capable de maintenir l'activité. Le PRA est donc synonyme d'importants enjeux financiers pour les entreprises dans la mesure où il leur permet d'assurer la prise en charge de leurs besoins informatiques nécessaires à leur survie même en cas de sinistre.

Pour mettre en place un PRA efficace, il faut identifier l'ensemble des applications les plus critiques pour établir le plan de bascule et de reconstruction. Les applications les plus critiques seront bien entendus les premières à être basculées et relancées. Il faut aussi établir le taux de perte minimum de données pour chaque application. En effet, certaines applications critiques n'acceptent que très peu, voire aucune, perte de données dans le cadre de leur activité.

Une fois ces premiers points définis, on obtient une ébauche de PRA avec une liste des applications les plus critiques à basculer et reconstruire.

Le PRA repose aussi essentiellement sur la sauvegarde de données. Ces réplications en continue des données et distribuées sur plusieurs datacentres permettent d'atteindre une haute disponibilité du système, des applications et données. Ces réplications se font à l'aide d'outils proposés par des constructeurs comme VPLEX d'EMC.

Le plan de reprise d'activité défini influe donc sur l'infrastructure des datacentres en prévoyant suffisamment d'espace de stockage pour les réplications et du matériel supplémentaire dans chaque datacentre pour assurer l'activité d'un autre site défaillant en cas de crise.

Si on prend le cas d'une entreprise telle que Google, dont l'activité repose totalement sur son infrastructure informatique, définir un PRA robuste et rapide est une obligation absolue. Une telle entreprise souhaite que son système d'information soit continuellement en marche. En effet, pour Google, des services inactifs entrainent une perte de revenus et d'informations sur ses clients. Les revenus normalement engendrés par les publicités et autres moyens utilisés par Google ne sont pas disponibles à cause de la panne d'un datacentre.

Si on conserve l'exemple de Google, on peut être certain qu'une telle entreprise possède plusieurs datacentres et va donc définir son PRA pour utiliser les performances de l'ensemble de ses bâtiments.

Prenons l'exemple de deux datacentres (un site primaire et un secondaire) et trois applications A, B et C:

deux datacentres et trois applications
Deux datacentres et trois applications

Les utilisateurs, représentés par les clients sur le schéma, seront routés vers l'un ou l'autre des datacentres en fonction des applications auxquelles ils souhaitent accéder. Les trois applications sont accessibles sur n'importe quel datacentre. Cependant, dans sa politique de performances, l'entreprise décide que les applications A et B ne seront accessibles que depuis le datacentre primaire et C que depuis le secondaire. Les données de chaque application sont cependant répliquées entre chaque site.

Admettons maintenant que le datacentre primaire soit tombé pour cause d'incendie par exemple:

un datacentre tombe
Un datacentre tombe

Une absence de PRA empêchera donc les utilisateurs d'accéder aux applications A et B puisqu'elles ne sont normalement accessibles que depuis le site primaire (qui est maintenant hors service).
Un PRA bien défini permet par contre à l'entreprise de continuer son activité. En effet, les applications sont hébergées sur les deux sites et les données sont continuellement répliquées. Il ne suffit "plus" que d'effectuer un re-routage automatique des utilisateurs vers le second site et activer les applications sur le datacentre secondaire.

Une telle solution technique peut reposer sur l'utilisation d'outils tels que Vmware vMotion pour permettre aux applications de naviguer d'un site vers un autre, EMC VPLEX pour la réplication des données entre deux datacentres et BGP pour le re-routage.