Simulations-Booster für die Nanoelektronik
Zwei Forschungsgruppen der ETH Zürich entwickelten eine Methode, die realit?tsnah, schnell und effizient elektronische Nanobauteile und deren Eigenschaften simuliert. Für die Industrie und Rechenzentrumsbetreiber ein Lichtblick. Gestern erhielten die Forscher für ihre Leistung den Gordon Bell Prize für Supercomputing.
Chip-Hersteller verbauen Transistoren, die nur wenige Nanometer klein sind. Ihr Durchmesser betr?gt nicht einmal ein Tausendstel eines menschlichen Haares, der bei feinem Haar etwa 20'000 Nanometer misst. Der Bedarf an immer leistungsf?higeren Hochleistungsrechnern treibt die Industrie an, noch kleinere und zugleich leistungsst?rkere Bauteile zu entwickeln.
ETH-Team erhielt Gordon Bell Preis
Neben physikalischen Gesetzm?ssigkeiten, die den Bau der winzigen Transistoren erschwert, weist das Problem der steigenden Selbsterhitzung die Hersteller jedoch zunehmend in ihre Schranken - unter anderem auch, weil der Kühlbedarf und infolgedessen der Energiebedarf enorm ansteigen. In einigen Rechenzentren mache die Kühlung der Rechner schon bis zu 40 Prozent des Strombedarfes aus, schreiben die Forschungsgruppen der ETH-Professoren Torsten Hoefler und Mathieu Luisier einer aktuellen Studie, mit der sie einen Verbesserungsansatz liefern wollen. Mit ihrer Studie wurden die Forscher gestern mit dem prestigetr?chtigen ACM Gordon Bell Prize geehrt, dem wichtigsten Preis im Bereich des Hochleistungsrechnen, der allj?hrlich auf der Supercomputing-Tagung (SC) in den USA vergeben wird.
Um heutige Nano-Transistoren effizienter zu machen, simuliert die Forschungsgruppe von Luisier vom Institut für Integrierte Systeme (IIS) der ETH Zürich Transistoren mit Hilfe der Software ?OMEN?, einem sogenannten Quantentransportsimulator.
OMEN erm?glicht eine realit?tsnahe atomare Aufl?sung des Transistors auf quantenmechanischer Ebene. Die Simulation macht sichtbar, wie der elektrische Strom durch den Nanotransistor fliesst und die Elektronen mit Kristallschwingungen wechselwirken. Die Forscher k?nnen darüber die Stellen, wo Hitze produziert wird, identifizieren. Die Simulation gibt somit wertvolle Hinweise auf Verbesserungsm?glichkeiten.
Mit herk?mmlichen Programmiermethoden und Supercomputern war es bis anhin nur m?glich, die Erhitzung von Transistoren aus rund 1000 Atomen zu simulieren, da die Datenkommunikation zwischen den Prozessoren und Speicheranforderungen eine realistische Simulation gr?sserer Objekte verunm?glichten.
Die meisten Computerprogramme verwenden einen Grossteil der Zeit damit, Daten zwischen Prozessoren, Hauptspeicher und externen Schnittstellen zu bewegen. In nur einem geringen Teil der Zeit rechnen sie. Auch in OMEN gab es laut den Wissenschaftlern einen ausgepr?gten, die Leistung schm?lernden Flaschenhals in der Kommunikation. ?Die Software wird heute in der Halbleiterindustrie benutzt, hat aber ein grosses Verbesserungspotential bei den numerischen Algorithmen und der Parallelisierung?, sagt Luisier.
Optimierte Simulation verbessert Transistoren
Bisher sei die Parallelisierung von OMEN nach der Physik des elektrothermischen Problems konzipiert worden, erkl?rt er. Nun schauten sich der Doktorand Alexandros Ziogas und der Postdoc Tal Ben-Nun unter Leitung von Torsten Hoefler, der das Scalable Parallel Computing Laboratory der ETH Zürich leitet, nicht die Physik, sondern die Abh?ngigkeiten zwischen den Daten an.
Sie reorganisierten die Rechenoperationen entsprechend dieser Abh?ngigkeiten, quasi ohne die Physik zu berücksichtigen. Bei der Optimierung des Codes hatten die Forscher Unterstützung von zwei der leistungsst?rksten Supercomputern der Welt, von ?Piz Daint? vom Nationalen Hochleistungsrechenzentrum der Schweiz (CSCS) und ?Summit? vom Oak Ridge National Laboratory in den USA. Laut den Forschern führt der optimierte Code zu gleich pr?zisen Ergebnissen in der Simulation wie die ursprüngliche Software OMEN.
Mit dem neuen Code namens DaCe-OMEN sei es erstmals m?glich, auf derselben Anzahl Prozessoren zehn Mal gr?ssere Transistoren, bestehend aus 10'000 Atomen, realit?tsnah zu simulieren – und das bis zu vierzehn Mal schneller als die ursprüngliche Methode für 1000 Atome brauchte. Insgesamt ist DaCe-OMEN um zwei Gr?ssenordnungen effizienter als OMEN: Auf ?Summit? konnte unter anderem ein realistischer Transistor bei einer kontinuierlichen Rechnerleistung (sustained performance) von 85,45 Petaflop pro Sekunde bis zu 140 Mal schneller berechnet werden. Dies auf 4'560 Rechnerknoten in doppelter Genauigkeit (double precision). Diese extreme Beschleunigung des Rechenvorgangs brachte den Forschern den externe Seite Gordon Bell Prize ein.
Datenzentrierte Programmierung
Die Optimierung erreichten die Wissenschaftler, indem sie Prinzipien der datenzentrischen parallelen Programmierung nutzten, die Hoeflers Forschungsgruppe entwickelte. Ziel ist, den Datentransport und somit die Kommunikation zwischen den Prozessoren so klein wie m?glich zu halten. ?Mit dieser Art von Programmierung k?nnen wir auf verschiedenen Ebenen eines Programms sehr genau feststellen, wo diese Kommunikation verbessert werden kann?, sagt Ben-Nun. ?Aber auch wie wir spezifische rechenintensive Abschnitte, sogenannte Computational Kernels, innerhalb der Berechnung eines einzelnen Zustands abstimmen k?nnen?. Diese mehrstufige Sichtweise erm?gliche es, eine Anwendung auf allen Ebenen zu optimieren, ohne diese jedes Mal neu schreiben zu müssen.
Die Datenbewegung wird dabei optimiert, ohne die ursprüngliche Berechnung zu ver?ndern – und das für jede beliebige Computerarchitektur. ?Wenn wir den Code für die Zielarchitektur optimieren, ?ndern wir diesen nur in der Ansicht des Performance-Ingenieurs, und nicht mehr in der des Programmierers, also des Forschers, der das wissenschaftliche Problem im Code formuliert?, sagt Hoefler. Dadurch etabliere sich eine einfache Schnittstelle zwischen Informatikern und interdisziplin?ren Programmierern.
Die Anwendung von DaCe-OMEN zeigte, dass die gr?sste Hitze nahe am Kanalende eines Nanotransistor entsteht, wie sie sich von dort ausbreitet und auf das gesamte System wirkt. Die Wissenschaftler sind überzeugt, dass sie das neue Verfahren zur Simulation solcher elektronischen Komponenten vielseitig anwenden k?nnen, beispielsweise auch beim Bau von Lithiumbatterien, deren ?berhitzung für unliebsame ?berraschungen sorgen kann.
Dieser Text von Simone Ulmer erschien in Englisch auf der Website des externe Seite CSCS.
Literaturhinweis
Ziogas AN, Ben-Nun T, Fernández GI, Schneider T, Luisier M & Hoefler T: A Data-Centric Approach to Extreme-Scale Ab initio Dissipative Quantum Transport Simulations, Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis (SC19), November 2019.