Modulare Supercomputing Architektur (MSA)

Die Modular Supercomputing Architecture (MSA) ist ein neuartiges Systemdesign zur Integration heterogener Ressourcen und zur Erfüllung der Anforderungen eines breiten Spektrums von Anwendungsbereichen, die von rechenintensiven, hochskalierenden Simulationscodes bis hin zu datenintensiven Workflows der künstlichen Intelligenz reichen.

Die MSA wurde im Rahmen der DEEP Projekten entwickelt.

Im Rahmen von MSA werden mehrere Rechenmodule von potenziell großer Größe - die jeweils auf die Bedürfnisse einer bestimmten Klasse von Algorithmen abgestimmt sind - auf Systemebene miteinander verbunden, um ein einziges heterogenes System zu schaffen (siehe Abbildung). Der Stromverbrauch wird in Grenzen gehalten, indem stromhungrige Allzweckverarbeitungskomponenten nur dort eingesetzt werden, wo sie unbedingt erforderlich sind (im Clustermodul). Energieeffiziente, hochparallele Technologien (z. B. GPUs) werden hochskaliert und für Codes mit hohem Durchsatz und Leistungsberechnungen eingesetzt (im Booster-Modul). Disruptive Technologien (z. B. neuromorphe oder Quanten-Technologien) können über spezielle Module integriert werden.

Ein übergreifendes Softwarestack ermöglicht es den Nutzern, die intrinsischen Anwendungsanforderungen (z. B. ihren Bedarf an verschiedenen Beschleunigungstechnologien und unterschiedlichen Speichertypen oder -kapazitäten) auf die Hardware abzubilden; hoch skalierbare Codeteile laufen auf dem energieeffizienten Booster (einem Cluster von Beschleunigern), während weniger skalierbare Codeteile von der Single-Thread-Leistung des Allzweck-Clusters profitieren. Ebenso werden neue Arten von hybriden Anwendungs-Workflows möglich sein, indem die Fähigkeiten von Modulen genutzt werden, die bahnbrechende Technologien implementieren (z. B. Quantencomputer oder neuromorphe Geräte), und zwar unter dem Dach des gemeinsamen Software-Stacks. Optimierungen für die Hardware und Middleware werden innerhalb des Stacks implementiert, so dass sowohl Entwickler als auch Endnutzer von Produktionscodes die Vorteile des modularen Systems nutzen können. Ein einheitlicher Software-Stack ist der Schlüssel zur Vereinfachung der Anwendungskopplung und zur Verbesserung der Agilität, da immer mehr Arbeitsabläufe eine komplexe Ausführungspipeline erfordern, um endgültige Ergebnisse zu erzielen.

Ein föderiertes Netzwerk verbindet die modulspezifischen Verbindungen, während ein optimierter Ressourcenmanager es ermöglicht, beliebige Kombinationen dieser Ressourcen entsprechend den Anforderungen der Anwendungsarbeitslast zusammenzustellen. Dies hat zwei wichtige Auswirkungen: Erstens kann jede Anwendung auf einer nahezu optimalen Kombination von Ressourcen laufen und eine hervorragende Leistung erzielen. Zweitens können alle Ressourcen sinnvoll genutzt werden, indem die Anwendungen komplementär kombiniert werden, was den Durchsatz und die Effizienz des gesamten Systems erhöht.

Letzte Änderung: 27.05.2022