Skip to main content

Fehlersuche für Atmosphärenchemie-Modelle auf HPC-Clustern

Wir unterstützten die Forschungsgruppe des RIFS bei der Analyse und Behebung intermittierender Fehler nach dem Umzug komplexer Atmosphärenchemie-Modelle auf ein neues Hochleistungsrechner-Cluster. Dabei schlossen wir die Lücke zwischen wissenschaftlicher Anwendungslogik und systemnaher Fehlersuche.

Auftraggeber

Forschungsinstitut für Nachhaltigkeit (RIFS)

Dauer

2 Wochen

Produkt

Dienstleistung

Expertise

Softwareentwicklung

Ziel

Ziel des Projekts war es, die Ursache intermittierender Fehler zu identifizieren und zu beheben, die nach der Migration auf einen neuen Hochleistungsrechner-Cluster auftraten. Dadurch sollte die zuverlässige Ausführung der Modellsimulationen auf der neuen Infrastruktur wieder ermöglicht werden.

Aufgaben

  • Analyse intermittierender Fehler nach dem Umzug der Simulationssoftware auf neuen Hochleistungsrechner-Cluster
  • Einarbeitung in den fachlichen Kontext und das beabsichtigte Verhalten des wissenschaftlichen Codes
  • Tiefgehende Untersuchung des Zusammenspiels von Anwendungscode, Systembibliotheken und Hardware des Rechenclusters
  • Identifikation der technischen Ursache des Problems
  • Behebung der gefundenen Fehlerursache
  • Verständliche Aufbereitung der Ergebnisse für das Forschungsteam und die Cluster-Administratoren

Herausforderungen

Eine zentrale Herausforderung bestand darin, dass nach dem Wechsel auf ein neues Hochleistungsrechner-Cluster eine nicht korrekt passende MPI-Konfiguration zu Laufzeitproblemen führte. Die Ursache lag damit nicht im fachlichen Modell selbst, sondern im Zusammenspiel von wissenschaftlichem Code, Systembibliotheken und Cluster-Umgebung. Dadurch war eine tiefgehende Analyse der systemnahen Konfiguration erforderlich.

Programmiersprachen

Bash

Technologien

MPI

Project Image

Schematische Darstellung eines Hochleistungsrechner-Clusters mit wissenschaftlicher Simulationssoftware.

Ähnliches Problem?

Zum Kontaktformular

Fazit

Im Projekt konnte die Ursache der Fehler identifiziert und behoben werden, sodass die Modellsimulationen auf dem Hochleistungsrechner-Cluster wieder ausführbar wurden. Das Projekt zeigte den Wert einer Brücke zwischen wissenschaftlicher Softwareentwicklung und systemnaher HPC-Analyse.

Ähnliche Projekte

Project Image

RIM2D - Hocheffiziente 2D hydraulische Simulation von fluvialen, pluvialen und urbanen Hochwassern

Hydrodynamische Simulation Webanwendung Geodaten GPU-Computing

RIM2D ist ein bestehendes, hocheffizientes 2D-hydraulisches Simulationsmodell für fluviale, pluviale und urbane Hochwasser. Wir unterstützten im Rahmen einer strategischen Partnerschaft dabei, den Forschungscode um eine Webanwendung und eine cloudbasierte GPU-Simulationsumgebung zu erweitern und so den Transfer in ein marktfähiges Produkt zu ermöglichen.

Project Image

Data Lake for Geoscience Research Data Management

Datalake Research Data Management Geodaten Cloud-Native Open-Source

Wir entwickelten eine S3-basierte Open-Source Datalake-Lösung zur zentralen Erfassung, Kategorisierung und Durchsuchbarkeit von Daten. Ziel war es, die manuelle Datenverwaltung durch eine integrierte Architektur mit Workflowsteuerung, Datenkatalog und Zugriffsschutz zu automatisieren und zu verbessern.

Zum Anfang