Anwendung eines Neuronalen Netzwerks
zur Klassifizierung von Antibiotikaresistenzen
mittels MALDI-TOF-Massenspektrometrie

(Stand: August 2025)

Hintergrund


Die Weltgesundheitsorganisation (WHO) hat antimikrobielle Resistenzen (AMR) im Jahr 2019 zu einer der zehn größten weltweiten Bedrohungen für die öffentliche Gesundheit erklärt. Eine frühzeitige Erkennung der Resistenz eines Pathogens ist entscheidend für eine effektive Behandlung, wodurch Leben gerettet und Kosten gesenkt werden können.

Aktuelle Methoden zur Spezies-Identifizierung mittels MALDI-TOF-Massenspektrometrie ermöglichen eine Bestimmung am Tag der Probenahme. Die Bestimmung der Antibiotikaresistenz erfordert jedoch typischerweise mehrtägige Kultivierungen des Pathogens. Die Nutzung der schneller verfügbaren Massenspektrometrie-Daten für die Resistenzbestimmung stellt daher einen erheblichen Vorteil dar. Methoden des Maschinellen Lernens und der Künstlichen Intelligenz (KI) sind bereits etabliert, um große Datenmengen zu klassifizieren und wurden auch erfolgreich auf MALDI-TOF-Daten angewendet, um Pathogene und deren antimikrobielle Resistenzen zu klassifizieren.

Dieses Anwendungsbeispiel dient als Proof-of-Concept, um die prinzipielle Eignung der Methode zur Klassifizierung von MALDI-TOF-Daten zu demonstrieren. Die Methode ist flexibel und kann auf andere Spezies oder Antibiotika ausgeweitet werden.

Anwendung


Daten

Für dieses Anwendungsbeispiel wird ein Teildatensatz eines öffentlich verfügbaren Datensatzes zur Antibiotikaresistenz humanpathogener Bakterien genutzt. Dieser Datensatz ist publiziert und online verfügbar.

Das primäre Interesse lag in der Erkennung einer Antibiotikaresistenz eines human-pathogenen Bakterienstammes aus einem Klinikumfeld anhand von MALDI-TOF-Daten. Hierfür wurden gezielt Proben aus dem Gesamtdatensatz extrahiert, für die entsprechende Informationen zur Antibiotikaresistenz in den Metadaten verfügbar waren. Der resultierende Teildatensatz umfasst nahezu 4.900 Proben und ist somit ausreichend groß für die Anwendung eines Neuronalen Netzwerks (NN).

Die Analyse der Datenverteilung zeigt, dass sowohl insgesamt als auch an den einzelnen Probenherkunftsorten (DRIAMS-A, DRIAMS-B, DRIAMS-C) deutlich mehr anfällige (S) als resistente (R) Proben vorlagen. Die Abkürzung DRIAMS steht hierbei für "Database of Resistant Isolate Archives for MALDI-TOF Spectra". Die Probenherkunftsorte DRIAMS-B und DRIAMS-C wurden ausschließlich im Jahr 2018 beprobt, während DRIAMS-A auch Proben aus den Jahren 2015 bis 2017 umfasst, was die höhere Probenzahl von diesem Ort erklärt. Die Anzahl resistenter Proben blieb in den Jahren 2016 bis 2018 weitgehend konstant, während die Anzahl anfälliger Proben zunahm.

DRIAMS-Daten_Verteilungen

Vorverarbeitung

Um die Rohdaten für die Eingabe in das Neuronale Netzwerk vorzubereiten, wurde eine spezifische Sequenz von Vorverarbeitungsschritten angewendet. Diese Schritte basieren auf der in der Originalpublikation des Datensatzes beschriebenen Methodik, wurden jedoch hinsichtlich der Algorithmen sowie der Bin-Anzahl angepasst. Die Vorverarbeitung ist als modulare Pipeline konzipiert, die es ermöglicht, verschiedene Algorithmen für jeden Schritt zu wählen, um eine optimale Merkmals-Extraktion zu gewährleisten.

Die Vorverarbeitung umfasste folgende Schritte:

  1. Transformation: Die Intensitätswerte wurden mittels Quadratwurzeltransformation normalisiert, um die Varianz zu stabilisieren und die Daten für die nachfolgenden Schritte besser handhabbar zu machen.
  2. Glättung: Zur Rauschunterdrückung wurde ein Savitzky-Golay-Filter eingesetzt. Dieser Algorithmus ist für die Glättung von Spektren besonders geeignet, da er die Signalform gut erhält.
  3. Baseline-Korrektur: Eine Baseline-Korrektur mittels des SNIP-Algorithmus wurde durchgeführt, um unspezifische Hintergrundsignale zu entfernen, welche die spektralen Peaks überlagern.
  4. Kalibrierung: Die Intensitätswerte wurden mittels Division durch den Total-Ion-Current (TIC) kalibriert, um die Vergleichbarkeit der Spektren, die mit unterschiedlichen Intensitäten aufgenommen wurden, zu gewährleisten.
  5. Trimming: Der m/z-Bereich der Spektren wurde auf 2.000 bis 20.000 m/z beschnitten, da dieser Bereich die relevantesten Signale enthält.
  6. Binning: Die vorverarbeiteten m/z- und Intensitäts-Daten wurden in 6.000 Bins von jeweils 2 Da Größe eingeteilt. Dabei wurden die Intensitäten innerhalb jedes Bins aufsummiert, was eine Reduktion der Datenmenge ermöglicht und gleichzeitig die wichtigsten spektralen Informationen für das NN bewahrt.

Hauptkomponentenanalyse (PCA)

Um die Eignung der vorverarbeiteten Spektren für das Training des Neuronalen Netzwerks zu bewerten, wurde eine Hauptkomponentenanalyse (PCA) der Spektren durchgeführt. Die PCA dient als statistische Methode zur Dimensionsreduktion und Visualisierung, indem sie die komplexen Spektren in wenige Hauptkomponenten überführt, welche die größte Variabilität im Datensatz repräsentieren.

DRIAMS-Daten_PCA1

Die ersten sechs Hauptkomponenten erklären in diesem Datensatz 53,6 % der Gesamtvarianz, was als relativ geringer Wert gilt. Die Proben wurden in einem Streudiagramm der ersten Hauptkomponenten farblich nach ihren Metadaten (Resistenzklasse, Probenherkunftsort und Jahr) markiert. Die Analyse zeigt keine klare Trennung zwischen resistenten (1) und nicht-resistenten (0) Proben. Gleichermaßen kann keine klare Trennung hinsichtlich Probenherkunftsort sowie -jahr festgestellt werden.

DRIAMS-Daten_PCA2

Dieses Ergebnis deutet darauf hin, dass die Hauptquellen der Variabilität im Datensatz nicht mit den biologischen Klassifizierungsmerkmalen korrelieren. Die PCA als lineare Methode war nicht in der Lage, die komplexen, nicht-linearen Zusammenhänge in den Daten zu erfassen. Dies rechtfertigt die Wahl eines komplexeren Modells wie dem Neuronalen Netzwerk, das die Fähigkeit besitzt, solche nicht-linearen Muster zu erkennen.

Neuronales Netzwerk (NN)


In diesem Anwendungsbeispiel wurde das Neuronale Netzwerk in Keras/TensorFlow implementiert. Für das vorliegende Klassifizierungsproblem wurde ein relativ einfaches Neuronales Netzwerk ausgewählt. Der Input-Layer reflektiert die 6000 Bins des Datensatzes. Die nachfolgenden versteckten Schichten (Hidden Layer) sind voll-vernetzt (Dense) und verwenden einheitlich die ReLU-Aktivierungsfunktion. Abschließend folgt ein binärer Output-Layer, welcher entscheidet, ob eine Antibiotika-Resistenz vorliegt oder nicht. Hierbei wurde die Softmax-Funktion als Aktivierungsfunktion eingesetzt.

Modellstruktur

Für das Training des Netzwerks wurde der Adam-Optimierer eingesetzt. Als Verlustfunktion (Loss) wurde die kategorielle Kreuzentropie genutzt, da diese Funktion die Diskrepanz zwischen den vorhergesagten Wahrscheinlichkeiten und den tatsächlichen Labels ideal für binäre Klassifikationsprobleme misst. Die zu maximierende Metrik war die Genauigkeit (Accuracy), definiert als der Prozentsatz der richtig vorhergesagten Proben. Der Datensatz wurde in 60% Trainingsdaten und jeweils 20% Validierungs- und Testdaten aufgeteilt. Um die Repräsentativität sicherzustellen, wurde eine stratifizierte Aufteilung vorgenommen, bei der die Verteilung der Resistenzklassen, Probenherkunftsorte und Jahre in allen drei Teildatensätzen gleich gehalten wurde.

Das Training des Netzwerks wurde in der Regel nach etwa 30 Epochen beendet, wenn sich die Verlustfunktion auf dem Validierungsdatensatz über 10 Epochen lang nicht mehr verbesserte. Dieses Abbruchkriterium diente dazu, eine Überanpassung des NN an den Datensatz zu verhindern und somit die Generalisierungsfähigkeit zu erhöhen.

Modellevaluierung

Nach dem erfolgreichen Training des Neuronalen Netzwerks wurde die Inferenz durchgeführt, um die Antibiotikaresistenz der Proben zu klassifizieren. Die rohen numerischen Ausgaben des Modells wurden in interpretierbare Labels umgewandelt: eine Vorhersage von 0 stand für die Anfälligkeitsklasse (S) und 1 für die Resistenzklasse (R).

Nach der Evaluation lagen die Genauigkeitswerte wie folgt vor:

  • Trainingsdaten: Accuracy von 0,97 mit einem Loss von 0,10
  • Validierungsdaten: Accuracy von 0,91 mit einem Loss von 0,28
  • Testdaten: Accuracy von 0,92 mit einem Loss von 0,24

Mit diesem einfachen Neuronalen Netzwerk konnten ca. 92 % der Testproben korrekt vorhergesagt werden. Eine derart hohe Wahrscheinlichkeit zur korrekten Klassifizierung von Proben unterstreicht das Potenzial der MALDI-TOF-Daten, in der Praxis zur Resistenzklassifizierung zu werden. Dies könnte die Behandlung von Infektionen im klinischen und tiergesundheitlichen Umfeld signifikant verbessern.

Fazit und Ausblick


Dieses Anwendungsbeispiel demonstriert die Machbarkeit und das Potenzial des Maschinellen Lernens für die schnelle und präzise Klassifizierung von Antibiotikaresistenzen basierend auf MALDI-TOF-Massenspektrometriedaten. Die Integration dieser Technologien in die Routinediagnostik könnte eine schnellere und gezieltere Therapie ermöglichen und somit einen wichtigen Beitrag im Kampf gegen antimikrobielle Resistenzen leisten.

Referenzen


  1. [1] K. Asakura et al.: Rapid and easy detection of low-level resistance to vancomycin in methicillin-resistant Staphylococcus aureus by matrix-assisted laser desorption ionization time-of-flight mass spectrometry. In: PLoS ONE, 13(3):e0194212, 2018. doi: 10.1371/journal.pone.0194212
  2. [2] H.-Y. Wang et al.: Efficiently Predicting Vancomycin Resistance of Enterococcus Faecium From MALDI-TOF MS Spectra Using a Deep Learning-Based Approach. In: Front. Microbiol., 13:821233, 2022. doi: 10.3389/fmicb.2022.821233
  3. [3] C. Weis et al.: Direct antimicrobial resistance prediction from clinical MALDI-TOF mass spectra using machine learning. In: Nat. Med., 28:164–174, 2022. doi: 10.1038/s41591-021-01619-9