Né en 2008, le concept de “Big Data” fait désormais tendance. Pas de définition précise. Le terme englobe tout à la fois la problématique et les technologies visant à traiter le gigantes que volume d’informations généré par les technologies IT. Difficile de quantifier le phénomène. A en croire le magazine The Economist, quelque 1200 exaoctets (milliards de gigaoctets) circulent désormais via le réseau informatique, contre 150 exaoctets en 2005. La consommation énergétique des data centers progresse également de façon exponentielle. Aujourd’hui, on estime que l’empreinte carbone des centres de calcul équivaut à celle de la navigation aérienne internationale. En 2010, les technologies de l’information représentaient 1,5% de l’énergie consommée aux Etats Unis, soit 4,5 milliards de dollars.

La viabilité économique du secteur IT dépend désormais de sa capacité à juguler ses besoins énergétiques, commente Babak Falsafi, professeur au Laboratoire d’architecture de systèmes parallèles et directeur du centre de recherche EcoCloud, les deux à l’EPFL. Pour freiner le niveau de croissance actuel, il faut parvenir à décupler l’efficience des processeurs et des mémoires par un facteur de 100 d’ici à dix ans.

C’est l’objectif que s’est fixé EcoCloud. Fondé en mai 2011, le consortium réunit 13 laboratoires de l’Ecole polytechnique fédérale de Lausanne (EPFL). Spécialisés dans les processus de cloud computing et la gestion de Big Data, les 14 informaticiens concernés collaborent sur trois axes de recherche clef: les données, l’énergie et l’intelligence.

Le paradoxe est que le nuage informatique contribue à augmenter la circulation de données, tout en représentant aussi le meilleur pôle d’économie pour le secteur IT, observe Babak Falsafi. Jusqu’à présent, l’industrie s’est appliquée à réduire le voltage des puces électroniques pour éviter que la consommation énergétique n’augmente au même rythme que la puissance de calcul des processeurs. Nous arrivons toutefois au bout de cette logique et n’avons plus d’autre choix que de travailler à la mutualisation des ressources pour optimiser les performances des centres de traitement.

Ce nouveau concept de développement oblige à repenser la totalité des architectures et des connectivités des data centers. Il implique une démarche holistique et un travail coordonné tant au niveau des logiciels que du hardware, des serveurs et des systèmes de refroidissement.

Au nombre des pistes prometteuses mises en oeuvre par EcoCloud figure un projet visant à optimiser le fonctionnement des machines et l’acheminement des données. Un autre pôle de recherche travaille à réguler la température des processeurs en fonction des actions programmées.

D’autres laboratoires oeuvrent à une nouvelle agrégation des informations ou à la résolution de bugs logiciels entièrement automatisée. Dénominateur commun des recherches: concevoir des outils hautement spécialisés destinés à effectuer des tâches ciblées de manière plus efficace et moins énergivore.

La puce tridimensionnelle

Le Laboratoire d’architecture de systèmes parallèles de l’EPFL collabore à l’élaboration d’une nouvelle génération de puce électronique.

Jusqu’à présent, les processeurs étaient destinés à réaliser des opérations mathématiques, résume Babak Falsafi. Avec l’avènement du nuage, leurs performances ne se mesurent plus seulement à leur puissance de calcul, mais aussi à leur capacité à accéder aux informations disponibles sur de sserveurs distants. Les téléphones portables utilisent déjà une technologie de ce type. Son transfert au secteur informatique exige toutefois une optimisation de l’interconnectivité et des procédures de traitement de grands volumes de données. Alors que les processeurs traditionnels utilisent une architecture bidimensionnelle composée d’unités de calculs alignés côte à côte, les chercheurs de l’EPFL ont conçu une puce électronique en trois dimensions utilisant des coeurs superposés.

Fondée sur la technologie Through Silicon Vias, cette nouvelle architecture verticale multiplie les connexions et accélère d’au moins 10 fois la vitesse de traitement des données, précise le professeur.

Les transactions améliorées

De son côté, le laboratoire de systèmes et d’applications de traitement archide données massives (DIAS) développe des technologies destinées à doper la performance des ordinateurs et à faciliter le maniement du Big Data. “Avant l’arrivée du nuage informatique, il suffisait de disposer d’une mémoire suffisante pour lire et organiser une certaine quantité d’informations, observe Anastasia Aïlamaki, cofondatrice d’EcoCloud et directrice de DIAS. Aujourd’hui les systèmes doivent puiser les données dans des unités de stockage distantes et les combiner de façon à obtenir une réponse rapide et fiable. Notre concept contribue à accroître l’efficacité des systèmes et à quantifier les ressources nécessaires à leur fonctionnement.” L’innovation s’applique notamment à la gestion des transactions financières. Dans une architecture traditionnelle, les ordres passés depuis plusieurs plateformes ne peuvent pas être effectués de manière simultanée. Les informations sont préalablement filtrées par un logiciel chargé de vérifier et de valider successivement chaque modification de valeur. Pour contourner ce verrouillage central qui participe à ralentir le trafic, DIAS a glissé une couche immatérielle dans son architecture logicielle. “Nous ne procédons pas à une structuration physique, mais à une organisation logique des informations, explique la directrice. Les données relatives à un même objet sont réunies dans des modules et transférées sous la forme d’une image virtuelle. Les processeurs concernés sont dès lors en mesure de synchroniser les opérations et de fournir des résultats quasi instantanés. La technologie garantit la fiabilité des transactions, tout en évaluant la puissance de calcul nécessaire à chaque opération. Les entreprises ont ainsi l’avantage de pouvoir planifier les ressources matérielles nécessaires à l’exécution des tâches qu’elles se sont fixées.”

Soutiens pécuniaires

Les travaux relatifs à cette architecture des plus novatrices ont été publiés l’an dernier et le laboratoire de l’EPFL a d’ores et déjà élaboré un prototype convaincant. A en croire son instigatrice, le produit serait désormais exploitable par le marché. “La mise en oeuvre de notre solution obligerait toutefois à repenser la globalité des structures informatiques.

La voie d’implémentation plus rapide consisterait à utiliser nos recherches pour l’élaboration d’un nouveau système core banking”, précise encore Anastasia Aïlamaki. Pour l’ heure, aucun candidat ne s’est manifesté. Le laboratoire oeuvre désormais au développement d’un outil de récupération de données. Il affine également ses algorithmes afin d’assurer leur compatibilité avec les nouvelles mémoires de changement de phase. Mieux connues sous l’abréviation PCM pour Phase change memory, ces unités de stockage pourraient s’avérer jusqu’à lOfais plus rapides que la mémoire flash et 1000 fois plus efficaces que les disques mécaniques traditionnels.

Récemment présentées lors de prestigieuses conférences IT à Hanovre et Athènes, les innovations du laboratoire DIAS ont suscité l’enthousiasme des experts, et aussi décroché de précieux soutiens financiers. Oracle s’est ainsi engagée à financer un plan de recherche axé sur l’utilisation de processeurs multicorps. IBM subventionnera pour sa part les travaux relatifs aux nouveaux supports de stockage de l’information. Les contrats renouvelables portent sur le versement global de quelque 180 000 francs par an.

Les ambitions de CS

A l’instar de la majorité des laboratoires académiques, les membres du réseau EcoCloud monnaient leurs services auprès des entreprises. Ils bénéficient en outre d’un pot commun alloué au consortium par des fonds de recherche suisses et européens et des partenaires industriels. Credit Suisse, HP, IBM, Microsoft, Nokia, Oracle, Swisscom et Intel financent en effet le projet à raison de l,7 million de francs par an. Première banque à s’être installée dans le Quartier de l’innovation de l’EPFL début 2011, Credit Suisse ne cache pas ses ambitions en matière de développement IT et mise sur la coopération pour accélérer son innovation. “Les recherches menées au sein d’EcoCloud s’inscrivent dans la logique des projets amorcés par l’établissement, commente Hans Martin Graf, directeur du Centre de développement IT de CS. Nous travaillons à la décentralisation de nos infrastructures depuis près d’une dizaine d’années, alors que les processus de virtualisation présentent encore de nombreuses inconnues. La mise en commun des compétences des divers spécialistes de l’EPFL est d’autant plus prometteuse qu’elle offre une approche globale de l’ensemble des problématiques liées au cloud computing.”

Réservoir de forces vives

Credit Suisse a entamé un programme d’optimisation énergétique de ses data centers avec le Laboratoire des systèmes intégrés de l’EPFL. Objectif: sélectionner les composants matériels et les systèmes les moins énergivores et les plus performants (voir aussi Green IT dans BAS septembre 2011). L’établissement bancaire négocie désormais de nouveaux axes de collaboration dans le domaine de la sécurité notamment. De nouveaux projets concrets devraient être lancés début 2012.

Dans l’intervalle, l’entreprise poursuit ses propres recherches dans le secteur du management de documents et des logiciels de gestion de portefeuille en particulier. Avec un investissement de quelque 10 millions de francs par an, le Centre de développement IT entend profiter des synergies offertes par son implantation au coeur de l’EPFL et souhaite affirmer son rôle d’employeur formateur. Forte d’une soixantaine de collaborateurs, la nouvelle entité de CS entend recruter une quinzaine de jeunes talents d’ici à la fin de l’année.

Une stratégie qui ne manquera pas de nourrir le réservoir de forces vives de l’établissement bancaire et participera sans nul doute à le préserver de la pénurie de spécialistes annoncée dans le secteur des technologies de l’information. La division informatique de CS emploie actuellement quelque 17 000 collaborateurs au plan mondial, dont 6000 en Suisse.