"Nous n'achetons pas simplement un nouvel ordinateur"
Le supercalculateur phare du CSCS, "Piz Daint", doit être remplacé. L'installation du calculateur successeur "Alps" se déroulera en trois phases et sera achevée en 2023. Thomas Schulthess, directeur du CSCS, explique dans une interview pourquoi le nouveau calculateur est si spécial.
Actualités ETH : La première phase d'installation du nouveau supercalculateur "Alps", successeur du "Piz Daint", a débuté l'année dernière. Comment les travaux se sont-ils déroulés jusqu'à présent pendant la crise de Corona ?
Thomas Schulthess : Nous avons certes d? modifier notre approche, mais nous avons pu plus ou moins respecter le calendrier, même s'il y a eu quelques petits décalages. Pendant le premier lockdown, il n'a pas été possible d'acheminer comme prévu les quatre premières armoires du nouvel ordinateur des Etats-Unis vers la Suisse. Mais le fabricant, HPE, a tout de même réussi à construire le matériel, si bien qu'en juin et juillet, nous avons eu accès à nos machines aux ?tats-Unis et avons pu travailler dessus. C'est pourquoi la réception des armoires informatiques à Lugano en automne s'est déroulée sans problème majeur.
L'extension d'"Alps" durera encore jusqu'au printemps 2023. Pourquoi cela dure-t-il si longtemps ?
Parce que le produit que nous voulons n'est pas encore complètement développé. L'élément central du nouveau calculateur est la pile logicielle Cray Shasta, au développement de laquelle nous avons participé avec d'autres centres de calcul. Cette pile logicielle est désormais opérationnelle. Néanmoins, il faudra encore deux ans pour que l'infrastructure informatique souhaitée soit entièrement prête.
Quelle est la particularité de la nouvelle infrastructure de calcul ?
Avec la pile logicielle Cray Shasta, nous avons opté pour une infrastructure définie par logiciel. C'est pour moi le point décisif. Sans cette pile logicielle, la nouvelle machine perdrait extrêmement de sa valeur à mes yeux. "Alps" serait certes toujours la meilleure variante dans le domaine du calcul haute performance qui sera disponible sur le marché dans un avenir prévisible. Mais nous avons clairement des objectifs plus élevés que nous n'atteindrions pas. Ce serait une grande déception.
Qu'est-ce que cela signifie exactement ?
Au CSCS, nous exploitons en premier lieu une infrastructure de recherche que nous mettons notamment à la disposition des chercheurs en tant que laboratoire utilisateur. C'est notre mission principale. Contrairement à d'autres infrastructures de recherche, comme par exemple le SwissFEL au PSI, nous ne faisons pratiquement pas de recherche sur nos instruments. Nous devons donc trouver un moyen créatif d'élargir notre propre expertise afin de pouvoir participer au développement de l'infrastructure de recherche. C'est pourquoi nous travaillons en étroite collaboration avec des chercheurs de différentes hautes écoles suisses.
Le CSCS ne se considère donc pas en premier lieu comme un prestataire de services ?
Si, mais pas dans l'esprit d'une entreprise informatique qui exploite des ordinateurs pour pouvoir offrir du temps de calcul. L'ordinateur est pour nous le moyen d'atteindre notre objectif, et cet objectif est l'infrastructure de recherche que nous construisons et développons avec des chercheurs gr?ce aux fonds du Conseil des EPF et que nous exploitons avec des contributions de l'ETH Zurich. Nous voulons maintenant développer cette infrastructure de recherche avec le programme Kathmandu.
En quoi consiste exactement ce programme ?
Le programme Kathmandu est une partie importante de la nouvelle acquisition mentionnée. Nous n'acquérons pas simplement un nouvel ordinateur qui sera intégré au centre de calcul inchangé, mais nous transformons le centre de calcul en plusieurs phases d'extension. Aujourd'hui, nous exploitons au CSCS différents systèmes informatiques répondant à différents besoins. A l'avenir, il n'y aura plus qu'une seule infrastructure. Pour MétéoSuisse, nous avons par exemple exploité jusqu'à présent notre propre ordinateur. A l'avenir, MétéoSuisse effectuera ses calculs sur une ou plusieurs partitions de cette nouvelle infrastructure.
"Nous transformons l'ensemble du centre de calcul en plusieurs phases d'extension".Thomas Schulthess
Quel est l'avantage de cette solution ?
Au CSCS, nous avons toujours proposé différents services aux chercheurs, mais l'architecture du système n'était pas orientée vers les services. C'est pourquoi nous devions à chaque fois définir ces services en fonction des exigences des utilisateurs et de l'architecture des machines, ce qui nécessitait beaucoup de personnel. Ce processus est désormais plus simple, car nous disposons d'une infrastructure définie par logiciel.
Qu'est-ce qu'une infrastructure définie par logiciel ?
Si nous faisons tout correctement avec HPE, nous pourrons à l'avenir utiliser notre matériel de manière très flexible. Nous définirons à l'avenir les services que nous proposons par le biais du logiciel et non plus du matériel. Pour cela, nous combinons ce que l'on appelle des microservices. Nous définissons ainsi les partitions pour les différents utilisateurs, que nous mettons ensuite à leur disposition via des interfaces standardisées. Il peut s'agir de clusters virtuels ad hoc pour des utilisateurs individuels, mais aussi de clusters prédéfinis que des infrastructures de recherche comme le PSI par exemple composent avec nous et exploitent ensuite elles-mêmes. Nous pouvons également créer des plateformes de données avec les microservices. Il est par exemple prévu que nous développions avec différents partenaires une plate-forme dite de domaine pour les simulations météorologiques et climatiques.
Vous citez explicitement le domaine de la météo et du climat. Alps" sera-t-il également utile à d'autres domaines scientifiques ?
Oui, nous développons avec "Alps" un "General Purpose Supercomputer". Nos objectifs ne s'arrêtent pas du tout aux simulations climatiques. Celles-ci sont toutefois un très bon moyen d'arriver à nos fins, car la problématique des simulations climatiques est très clairement formulée. De plus, elles reflètent toutes les exigences d'une infrastructure moderne de supercalcul et de données. Nous répondons à ces exigences très concrètes par une infrastructure que nous pouvons ensuite proposer à d'autres domaines de recherche.
Qu'est-ce que cela change pour les utilisateurs du laboratoire utilisateur ?
Les utilisateurs actuels de "Piz Daint" pourront utiliser le nouveau système sans aucune adaptation. Cela devrait même être plus facile pour eux. Nous allons également continuer à développer la plate-forme HPC pour le User Lab en tant que zone virtuelle au sein du système informatique. Les ressources seront ainsi plus performantes et couvriront une plus grande partie du flux de travail. Les scientifiques pourront non seulement effectuer des simulations chez nous, mais aussi prétraiter ou posttraiter leurs données. L'ensemble du processus devient ainsi plus efficace.
Pour les utilisateurs, il n'y aura donc pas beaucoup de changements. Que signifie la transformation pour les collaborateurs du CSCS ?
La nouvelle stratégie nécessitera un changement fondamental de mentalité dans certains domaines. Les ingénieurs système et support utilisateur devront par exemple changer leur fa?on de penser, car nos ordinateurs actuels, que nous exploitons en plus de "Piz Daint", seront à l'avenir des clusters virtuels. Certains collaborateurs développeront et entretiendront des microservices, d'autres combineront ces microservices en clusters ou applications virtuels qui seront ensuite mis à la disposition des chercheurs sous forme de services.
"La nouvelle stratégie nécessitera un changement fondamental de mentalité dans certains domaines".Thomas Schulthess
De gros efforts sont actuellement déployés en Europe pour faire progresser le supercalculateur. L'initiative pré-exascale de l'UE en fait notamment partie. Comment le CSCS participe-t-il à ces efforts ?
Le CSCS est membre du consortium LUMI, qui fait partie de l'initiative pré-exascale. Cet acronyme signifie "Large Unified Modern Infrastructure". Il s'agit d'un nouveau supercalculateur de classe pré-exascale qui sera installé en Finlande. Le consortium LUMI regroupe dix pays membres, dont les pays scandinaves, où les conditions sont réunies pour produire de l'électricité bon marché et neutre en CO2-libre d'électricité et le refroidissement des ordinateurs sont optimaux.
Pourquoi cet aspect est-il si important ?
Cela peut être expliqué à l'aide de la recherche climatique. Notre objectif est de développer des modèles climatiques capables de reproduire les nuages convectifs, comme les nuages d'orage. "Alps", le successeur de "Piz Daint", aura une puissance de raccordement de 5 à 10 mégawatts. Une infrastructure informatique qui doit fournir de manière productive la résolution susmentionnée pour les sciences climatiques doit toutefois être 50 fois plus puissante. Comme nous ne pouvons plus obtenir de gains de performance gr?ce à la loi de Moore, nous avons besoin d'une machine cinquante fois plus grande que l'"Alps", ce qui entra?nera une augmentation correspondante de la consommation d'énergie. Il est donc judicieux de construire à l'avenir une telle infrastructure informatique là où l'énergie nécessaire peut être produite de manière avantageuse et respectueuse de l'environnement. Nous n'avons pas de tels sites en Europe centrale, mais nous en avons en Europe du Nord.
Quel est le calendrier de LUMI ?
Le calculateur LUMI est également construit par HPE et devrait atteindre la classe de performance pré-exascale à l'automne 2021 et être mis en service au printemps 2022. Notre système "Alps" sera prêt à être installé un an et demi plus tard, fin 2022, et remplacera "Piz Daint" à partir d'avril 2023. Mais nos nouveaux services seront déjà disponibles ce printemps et pendant les premières phases d'extension en été/automne ; et nous essayons également d'intégrer LUMI. Nous disposerons alors d'une infrastructure globale très solide, fonctionnant sur deux sous-infrastructures, "Alps" et LUMI. Nous avancerons dans cette direction plus rapidement que d'autres en Europe.
Cela signifie-t-il qu'à l'avenir, les ressources informatiques suisses seront transférées à l'étranger ?
Non, mais nous devons être réalistes : Nous n'exploiterons jamais en Suisse des ordinateurs de 100 MW ou plus. Nous devons concentrer les ressources locales de calcul en Suisse sur des projets pilotes innovants et les intégrer dans un réseau plus vaste pour la production. Notre intention est de développer des plateformes logicielles qui fonctionnent sur les deux infrastructures, de sorte que les utilisateurs ne remarquent pratiquement pas si leur application fonctionne en Finlande ou à Lugano.
Le supercalculateur à Lugano
Le Centre suisse de calcul scientifique (CSCS) développe et met à disposition, dans le domaine du calcul à haute performance, l'infrastructure et le savoir-faire nécessaires à la résolution de problèmes scientifiques et sociaux importants. Il met en ?uvre la stratégie nationale pour le calcul à haute performance et les réseaux, adoptée par le Parlement suisse en 2009. Depuis 2011, le CSCS dispose d'un laboratoire utilisateur pour le supercalcul et il fait partie de la feuille de route suisse pour les infrastructures de recherche. Depuis 2020, il est également membre du consortium européen LUMI, qui met en place un supercalculateur européen de classe de performance pré-exascale.