Open-Access-Publikation des Monats – Chadi Barakat (JSC) et al.

8. Februar 2023

Um den Blick über den Tellerrand anzuregen, wählt die Zentralbibliothek einmal im Monat für den Newsletter des Forschungszentrums Jülich eine Open-Access-Veröffentlichung aus der Publikationsdatenbank JuSER aus.

In der Open-Access-Publikation des Monats schreiben Chadi Barakat (JSC, University of Iceland (UI)), Marcel Aach (JSC, UI), Sigurður Brynjólfsson (UI), Andreas Schuppert (Uniklinik der RWTH Aachen), Sebastian Fritsch (JSC, Uniklinik der RWTH Aachen) und Morris Riedel (JSC, UI) über die Entwicklung und Verwendung einer modularen Plattform für maschinelles Lernen und Data Science, auf der diagnostische ML-Modelle entwickelt, getestet und eingesetzt werden können.

Die Publikation beschreibt, wie das von Wang et al. für die schnelle COVID-19-Diagnostik entwickelte COVID-Net-Modell mithilfe neuer Daten des Industriepartners E*Healthline im Rahmen der EOSC-Fast-Track-Förderung für COVID19-Forschung des EuroCC-Projektes nachtrainiert wurde.

Die ursprünglichen – bereits zuvor veröffentlichten – Ergebnisse zeigten, dass COVID-Net mithilfe der neuen Daten nachtrainiert werden musste, um Vorhersagen im akzeptablen Bereich zu erzielen. Es zeigte sich zudem, dass die Ergebnisse selbst nach mehreren Trial-and-Error-Runden nur bedingt akzeptabel waren, um eine Kombination von Parametern für das Modell-Training auszuwählen. Zur Vereinfachung dieses Prozesses entwickelten die Autoren eine Plattform, auf der sie an der Lösung dieser spezifischen Aufgabe arbeiten konnten, die sich aber auch leicht an spätere Aufgaben des maschinellen Lernens anpassen lässt. Die Autoren führten eine parallelisierte Hyperparameteroptimierung auf der Plattform durch, um die Kombination von Parametern zu ermitteln, mit denen das COVID-Net-Modell die beste Leistung auf ihre Daten erzielen konnte. Anschließend verwendeten sie diese Parameter, um das Modell umfassend nachzutrainieren. So konnten sie die Leistungssteigerung und – wichtiger noch – die Geschwindigkeitssteigerung verdeutlichen, die durch die Hochskalierung der verfügbaren Rechenressourcen erreicht werden kann. Da die Plattform auf frei verfügbare Daten und Open-Source-Software zurückgreift, kann sie problemlos auf kommerzielle Cloud-Computing-Plattformen übertragen werden. Die Autoren sind der Auffassung, dass dies medizinischen Einrichtungen die Möglichkeit eröffnet, eigene Diagnosemodelle zu entwickeln. Diese Modelle könnten dann einfach als eigenständige Module exportiert und bei Bedarf problemlos implementiert werden – insbesondere unter zeitkritischen Umständen wie in den frühen Anfängen der COVID-19-Pandemie.

Die Open-Access-Publikation mit dem Titel „Analysis of Chest X-ray for COVID-19 Diagnosis as a Use Case for an HPC-Enabled Data Analysis and Machine Learning Platform for Medical Diagnosis Support“ wurde in der Zeitschrift „Diagnostics“ in einer Sonderausgabe zum Thema künstliche Intelligenz im Bereich bildbasiertes Screening, Diagnostik und klinische Behandlung von Herz-Lungen-Erkrankungen veröffentlicht.
Publikationsportal JuSER – Analysis of Chest X-ray for COVID-19 Diagnosis as a Use Case for an HPC-Enabled Data Analysis and Machine Learning Platform for Medical Diagnosis Support

Internet – Institute for Advanced Simulation– Jülich Supercomputing Centre (JSC)

Internet (ZB) – Open Access

Letzte Änderung: 07.02.2023