Publié le 21.11.2024

France 2030

Supercalculateur Jean Zay : en immersion avec les équipes de l'IDRIS-CNRS

Acquis par l'intermédiaire de la société GENCI, le supercalcuteur Jean Zay est depuis 2019, l'un des plus puissants de France. À quels enjeux répond-il ?

Pierre-François Lavallée, je suis le directeur de l'IDRIS, le centre national du calcul haute performance et l'infrastructure nationale pour la communauté d'intelligence artificielle du CNRS. Bonjour, je suis Léo Hunout, je suis ingénieur au support IA de l'IDRIS sur le calculateur Jean Zay. Le supercalculateur Jean Zay a été installé en 2019. C'est aujourd'hui le supercalculateur le plus puissant de France. Il a une puissance de 126 pétaflops, 126 millions de milliards d'opérations flottantes par seconde. Pour faire fonctionner un super ordinateur comme Jean Zay, on a besoin de beaucoup d'équipes, à différents niveaux, au niveau du matériel ou sur la partie logicielle. Au sein du support utilisateur, je m'occupe, plutôt en fin de chaîne, d'aider les nombreux utilisateurs de l'IDRIS à faire tourner leurs codes et applications sur le supercalculateur en essayant d'accélérer leur prise en main de la machine, afin qu'ils puissent utiliser facilement l'ordinateur, parce que ce n'est pas un ordinateur si simple que ça, mais aussi en allant un peu plus loin, en essayant d'optimiser leurs codes, dans le but tout simplement soit de réduire les ressources consommées ou de pousser le plus loin possible la recherche à ressources constantes. Le supercalculateur est un très grand instrument. Les ressources sont distribuées par un organisme, qui a acheté la machine Jean Zay, qui s'appelle Genci. On s'adresse essentiellement au monde académique de la recherche. On a plus de 3000 utilisateurs sur le supercalculateur. Il faut savoir que les accès sont gratuits. Le seul critère qui est pris en compte pour obtenir des ressources, c'est la qualité scientifique des projets. Ensuite, les meilleurs projets vont avoir le droit d'obtenir une allocation sur la machine. Ces projets peuvent être des projets de recherche académique, mais aussi des projets de recherche privée, sous une condition, c'est de faire ce qu'on appelle de la recherche ouverte. Pour nous, ça veut dire publication des résultats qui ont été obtenus en utilisant des ressources du supercalculateur. Donc cela peut être les algorithmes, les résultats scientifiques, les données qui sont utilisées. Tout ça doit être disponible pour pouvoir reproduire la recherche qui a été faite par le supercalculateur. Historiquement, il y a 4-5 ans... L'IA c'est un domaine qui est très jeune et très dynamique. L'IA, c'était beaucoup du machine learning, c'était de l'analyse de données qui ne pouvait pas forcément traiter des quantités de données gigantesques. Par la suite, il y a eu une tendance importante au niveau de l'image, parce que les premiers résultats scientifiques, qui ont ensuite été transférés vers des applications, ont été les plus probants. Typiquement la détection des chiffres est un des premiers exemples d'IA en deep learning [apprentissage profond] qui a très bien marché. Cela permet de classer les lettres, de récupérer les chiffres quand vous mettez un chèque à la banque. Il y avait vraiment un domaine d'applications qui en découlait très facilement et qui était très visible. Par la suite, l'image a continué, on a commencé à avoir le texte, le traitement des langues, qui permet là aussi d'avoir un flot d'applications qui est très important. Et maintenant, depuis 2-3 ans, on commence vraiment à avoir l'IA qui rentre dans toutes les sphères scientifiques, où on s'aperçoit que les méthodes qui ont été développées, comme je le disais sur les utilisations de l'image ou de la langue, peuvent être appliquées à d'autres thématiques. Il y a quelques années, on a eu l'apparition des premiers modèles capables de faire le repliement de protéines avec AlphaFold. Maintenant, on a les modèles qui sont capables de traiter du texte, ce qui permet d'avoir des bases de connaissances très importantes. On a des modèles qui sont capables de prédire, faire des prédictions du moins, sur les tremblements de terre, sur le climat. C'est très large. Au niveau de la chimie, on arrive à prévoir des nouvelles molécules. Il y a une infinité de domaines. Dans tout ce qui est sciences sociales, on peut utiliser les modèles actuels pour faire de l'analyse de données sur les emplois, sur le logement, sur l'administration. C'est très large. L'IA est capable de faire ce que l'humain n'est pas capable de faire, dans le sens où il est capable de travailler sur de très grandes masses de données et d'extraire des signaux faibles qui sont complètement invisibles à l'humain. Par exemple pour post-traiter des résultats qui sont issus de radiotélescopes, des résultats qui sont issus de synchrotrons. Et on se rend compte que de plus en plus, l'IA va être indispensable dans tous les domaines scientifiques.

Jean Zay, au cœur de la machine

Pour maintenir sa compétitivité dans un domaine en pleine expansion, le supercalculateur Jean Zay s'est doté de trois extensions successives depuis 2019. Sa puissance cumulée est à présent de 125,9 Pétaflop/s (soit quasiment 126 millions de milliards d'opérations flottantes par seconde).

Trois aspects confèrent au supercalculateur sa puissance :

  • le calcul (à travers les « GPU » pour Graphics Processing Unit ou processeur graphique),
  • le réseau (qui permet d'échanger les informations grâce à l'interconnexion entre les différents nœuds de calcul),
  • le stockage.

Pourquoi tant de puissance ?

Le positionnement scientifique du supercalculateur Jean Zay a été décidé dans le cadre de la Stratégie nationale pour l’IA.

Cet accroissement intervient afin d'entraîner des modèles d’IA dits « de fondation » ainsi que des modèles d’IA générative.

126 PFlop/s  c'est la puissance du supercalculateur soit 126 millions de milliards d'opérations flottantes par seconde

40 M€ de financement issu du plan France 2030

Quels domaines le calcul intensif pour l'IA concerne-t-il ?

Ces modèles d'IA concernent tant les domaines du traitement des langues, de la vision, de l’information multimodale, que ceux de la biologie, de la santé, des matériaux, des nouvelles énergies, des mobilités décarbonées, de la physique fondamentale, du climat et de la météo.

L'IA est capable de travailler sur de très grandes masses de données et d'extraire des signaux faibles qui sont complètement invisibles à l'humain. 

Pierre-François Lavallée,
Ingénieur de recherche et directeur de l’Institut du Développement et des Ressources en Informatique Scientifique (IDRIS - CNRS)

L’IDRIS

L’Institut du développement et des ressources en informatique scientifique, fondé en 1993, est le centre majeur du CNRS pour le calcul à très haute performance et l’utilisation des paradigmes de l’intelligence artificielle. Situé sur le plateau de Saclay, l'IDRIS participe, avec les autres centres nationaux, à la mise en place de ressources informatiques nationales, au service de la communauté scientifique de la recherche publique qui nécessite des moyens informatiques à hauteur des ambitions du pays.

Quel est le fonctionnement du supercalculateur Jean Zay ?

Le supercalculateur Jean Zay est un très grand instrument qui mobilise, au sein de l'IDRIS, des personnels dédié au matériel ainsi qu'au logiciel. Il nécessite en outre d'accompagner au quotidien les équipes de recherche qui utilisent la machine.

3 à 4 M€de budget annuel alloué à la consommation électrique de la machine

6500 MWh/an Récupération de chaleur

96 tonnesd'équipement réparti sur 320 m²

L’allocation de ressources sur la machine est gratuite, tant pour les laboratoires issus d'organismes de la recherche publique que d'entreprises privées. Pour obtenir des ressources, les meilleurs projets de recherche sont sélectionnés sur des critères de qualités scientifique et académique par un jury constitué de 9 comités thématiques. La seule condition étant de faire de la recherche ouverte, c'est-à-dire de publier les résultats (algorithmes, résultats scientifiques, données...) obtenus grâce à la machine, afin que la recherche soit reproductible.

Un supercalculateur éco-efficient

Bien que le calcul haute performance soit énergivore, Jean Zay est l’un des superordinateur les plus éco-efficients d’Europe grâce à :

  • l’utilisation massive de technologies accélérées (GPU)
  • et à un refroidissement des serveurs de calcul par eau chaude à cœur (32°).

La chaleur fatale de la machine, c'est-à-dire, la chaleur qui émane de l'utilisation du superordinateur, est en outre réutilisée pour contribuer au chauffage de plus de 1 000 logements sur le plateau de Saclay (et ce, grâce à un investissement commun entre le CNRS et l’EPA Paris Saclay).

Jean Zay (1904-1944)

Ministre de l'Éducation nationale et des Beaux-arts entre juin 1936 et septembre 1939, Jean Zay a été assassiné le 20 juin 1944 par la Milice.

Durant ses mandats, il met en œuvre d'importantes évolutions de notre système d'éducation ; il est notamment à l'origine de la création du musée d’Art moderne, du musée de l'Homme et du festival de Cannes. Ayant sous sa responsabilité le sous-secrétariat d'État à la recherche, occupé par Irène Joliot-Curie (juin à septembre 1936) puis par Jean Perrin, avec lequel il prépare toutes les étapes qui conduiront à la création du CNRS le 19 octobre 1939. C'est en hommage à Jean Zay et à l'occasion du quatre-vingtième anniversaire du CNRS, en 2019, qu'a ainsi été nommé le nouveau supercalculateur.
Jean Zay est entré au Panthéon le 27 mai 2015.

Partenaire(s)

Voir aussi

Crédits :
Adobe Firefly AI / MESR

Image générée par intelligence artificielle

Crédits :
Adobe Firefly AI / MESR

Image générée par une intelligence artificielle