SuperMUC

Am Donnerstag, den 14.11.2019 beehrte uns Prof. Dr. Dieter Kranzlmüller, Leiter des Leibniz-Rechenzentrums (nicht zu verwechseln mit dem Leibniz-Institut) mit einem Vortrag über den SuperMUC, zu diesem Zeitpunkt auf Platz 9 der besten Computer der Welt.

Das Leibniz-Rechenzentrum stellt seit 1962 seine Dienste zur Verfügung. Darunter fallen unter anderem IT-Services für TUM und LMU, BayernShare, eine Art Dropbox für bayerische Wissenschaftler und die Aufgabe, den stärksten Computer Deutschlands zu haben. Dieser Computer mit dem Namen SuperMUC steht jedem deutschen Wissenschaftler kostenlos zur Verfügung, sofern dessen Bewerbung mit entsprechendem Forschungsvorschlag angenommen wird. Auch an Wissenschaftler aus dem Rest von Europa wird Rechenzeit vergeben, jedoch ist dieser Anteil deutlich geringer. Allerdings ist der SuperMUC ausschließlich für zivile Anwendungen gedacht, militärische Projekte beispielsweise werden, auch wenn noch so viel Geld geboten wird, grundsätzlich abgelehnt.

Die Rechenleistung des SuperMUC wird hauptsächlich für Modelle und Simulationen zum Beispiel von Erdbeben, Blutbahnen oder Galaxien verwendet. Weiterhin kooperiert das LRZ auch mit der Umweltforschungsstation auf der Zugspitze, aber auch für weniger rechenintensive Zwecke steht der Supercomputer zur Verfügung. So spielte zum einen in einer Folge “Tatort” der Rechner eine große Rolle und auch für den Film “Snowden” wurde im Inneren des SuperMUC-Gebäudes gedreht.

Das Gebäude selbst ist bereits ein Forschungsprojekt, da relativ wenig Daten zu Bau und Betrieb von Supercomputern vorliegen. Die Racks befinden sich im obersten Stockwerk, da dort keine Säulen im Raum vorhanden sind. Gekühlt werden die Prozessoren mit heißem Wasser (40 bis 45°C), welches, sobald es eine Temperatur von 68°C erreicht, aufs Dach gepumpt wird, wo es dann herunterkühlt und wieder ins Gebäude zurückgeführt wird. Der Wasserbedarf hierfür liegt bei 3000 Litern pro Rack und Stunde. Weiterhin anzumerken ist noch, dass im SuperMUC keinerlei GPUs verbaut sind. Dennoch liegt die Leistung der ersten Phase des SuperMUC bei etwa 3,2 PetaFLOPS und die zweite Phase schafft 3,6 PetaFLOPS, benötigt jedoch nur ein Viertel der Fläche und ein Drittel des Stromverbrauchs von Phase 1, welche dann wegen mangelnder Effizienz auseinandergenommen wurde. Die nächste Phase, gennant NextGen, besteht aus ca. 311.000 Kernen, welche eine Leistung von ungefähr 26,9 PetaFLOPS erbringen können. Weiterhin steht ein 719 TB großer Arbeitsspeicher zur Verfügung. Das Ziel beim Benchmarking dieser Phase war es, gerade noch so in den Top 10 der besten Rechner der Welt zu landen und dann sofort aufzuhören, um damit zwar den Auftrag der Regierung zu erfüllen, dabei aber Geld zu sparen, um dieses dann sinnvoller zu investieren, denn die Stromkosten des Großrechners liegen bei 1000-1200€ pro Stunde und der Verbrauch insgesamt entspricht dem dreifachen Stromverbrauch von ganz München. Verschiedene Benchmarks erzielen jedoch unterschiedliche Ergebnisse: So liegt der SuperMUC bei einem SSSP-Benchmark auf Platz 1 und LINPACK-Benchmarks eignen sich ebenfalls hervorragend als Reliability-Test für die Infrastruktur, denn sollten wichtige Teile der Infrastruktur nicht vernünftig funktionieren, merkt man das sofort daran, dass das gesamte System ausfällt und es irgendwo verschmort riecht. Aber nicht nur fehlerhafte Teile sorgen für Ausfälle, auch zu viel Staub kann trotz Einhalten der vom Hersteller angegebenen Reinigungshäufigkeit eine Ursache sein. Sollte die Stromversorgung komplett wegfallen, ist das nicht weiter kritisch, solange der Stromausfall weniger als 11 Sekunden dauert, denn solange drehen sich die großen Antriebsräder von alleine weiter. Durchschnittlich gibt es etwa alle 9 Stunden einen Ausfall und ein anschließender Neustart dauert 8 Stunden.

Bei der Stromversorgung wird auf erneurbare Energien gesetzt und im Sinne der Nachhaltigkeit wird auch die von den Prozessoren erzeugte Wärme wiederverwendet, um das LRZ zu heizen. Danach bleibt jedoch immmer noch sehr viel warmes Wasser übrig, für das noch ein Verwendungszweck gesucht wird, denn aus bürokratischen Gründen lässt sich diese Idee nicht auf München und Umgebung erweitern. Sollte sich die Gelegenheit ergeben, zieht Prof. Kranzlmüller in Erwägung, mithilfe des SuperMUC ein bayerisches Grundnahrungsmittel zu produzieren.

Wir haben uns sehr gefreut, so vielseitige und detailreiche Einblicke in das Innenleben eines Supercomputers zu erhalten und bedanken uns herzlich für den interessanten Vortrag.