blog2geek.com
GuillaumeAvatar de Guillaume

42 billets | Profil

Recherche Google

ce blog tous
Derniers billets Connexion
Archives

espace-g

07/07/2006

Google, du matériel

Le moteur de recherche de Google repose sur une architecture solide. Les calculs sont partagés sur des « clusters », c’est-à-dire des ensembles d’ordinateurs mis en réseau. Ainsi, on peut répartir la charge entre les différents ordinateurs, ce qui empêche la surcharge. Chaque poste du réseau ainsi constitué contient une partie de la base de données d’indexation. La répartition de celle-ci est faite de manière à être répétées identiquement sur plusieurs postes, ce qui évite les défaillances du matériel (les ordinateurs, sollicités en permanence, ont des espérances de vie faibles). Débrancher un poste du réseau n’entraîne pas l’arrêt du service puisqu’un autre prend la relève. La puissance de calcul se trouve seulement un peu plus faible en attendant le remplacement. En même temps, les informations que l’on savait détenues par le poste tombé en panne sont dupliquées sur d’autres postes. Ces clusters sont répartis un peu partout sur le globe, permettant un accès local plus rapide, et l’élimination du risque de voir toute l’infrastructure détruite d’un seul coup par une catastrophe naturelle ou autre. Des « centres de données » (data centers), reçoivent régulièrement des mises à jour de l’index. Ils sont destinés à être interrogés par les internautes. Ce sont à eux que l’on accède lorsque l’on fait une recherche sur Google.