close-icon
Erhalte regelmäßige Updates zu MS2DeepScore.
Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.

MS2DeepScore - eine Alternative zu Spektralvergleichen

Wie ein Deep Learning Modell anhand von MS/MS-Spektren die strukturelle Ähnlichkeit berechnet.

datarevenue-icon
by
DataRevenue
Markus Schmitt

MS2DeepScore - eine Alternative zu SpektralvergleichenAls Indikator für strukturelle Ähnlichkeit werden in der Regel spektrale Ähnlichkeitswerte verwendet. Diese beiden Werte unterscheiden sich in vielen Fällen jedoch erheblich voneinander, was die Treffersuche in Bibliotheken erschwert. Daher haben Florian und sein Team ein Deep Learning Modell entwickelt, das die strukturelle Ähnlichkeit anhand von Tandem Massenspektren zuverlässiger vorhersagen kann.

Spektralvergleiche sind Bestandteil jedes Metabolomik Workflows

Ein entscheidender Schritt jedes Metabolomik Analyseprozesses besteht darin, die massenspektralen Messungen mit den Messungen aus einer Datenbank zu vergleichen. Diese Vergleiche müssen zuverlässig sein, um:

  • Die Verbindung zuzuordnen: Du suchst in einer Referenzbibliothek nach einer Verbindung, die dem Fragmentierungsmuster deiner Messung entspricht.
  • Nach analogen Verbindungen zu suchen: Durch Suchen nach ähnlichen Fragmentierungsmustern findest du strukturell verwandte Verbindungen. 
  • Die Struktur-Familie zu identifizieren: Um die Auswahl an möglichen Überschneidungen einzugrenzen, verknüpfst du dein Molekül mit einer Molekülklasse.

Bei der Tandem-Massenspektrometrie wird ein Kosinuswert zwischen verschiedenen Massenspektren errechnet, um sie miteinander zu vergleichen. Ein hoher Kosinuswert bedeutet, dass die Fragmentierungsprofile zweier Verbindungen stark überlappen.

Es scheint plausibel, dass ein hoher Kosinuswert auch immer mit einer hohen strukturellen Ähnlichkeit einhergeht. Der Kosinuswert bezieht sich allerdings lediglich auf die spektrale Ähnlichkeit. Wenn du jedoch deine Verbindungen annotieren willst, ist die strukturelle Ähnlichkeit entscheidend. Das ist ein wesentlicher Unterschied.

Spektrale und strukturelle Ähnlichkeit: Äpfel und Birnen

Betrachten wir die Unterschiede einmal genauer:

  1. Spektrale Ähnlichkeit, z. B. die Kosinus-Ähnlichkeit, misst die Überlappung von zwei massenspektralen Profilen.
  2. Strukturelle Ähnlichkeit, wie der Tanimoto-Score, quantifiziert die Überlappung zweier molekularer Muster mittels einer 2D-Vektordarstellung der molekularen Strukturen.

Die spektrale Ähnlichkeit unterscheidet sich von der strukturellen Ähnlichkeit zum Teil sehr deutlich. Das kann dazu führen, dass ein angeblicher Treffer in einer Datenbank in Wirklichkeiten der gemessenen Verbindung gar nicht strukturell ähnlich ist..

Nehmen wir beispielsweise das Antibiotikum Daptomycin (oben) und ein hypothetisches Analogon (unten): 

Auf der rechten Seite sind zwei zyklische Peptide zu sehen, wobei drei leichte Strukturänderungen durch grüne Kreise markiert sind. Die vorhergesagten Fragmentierungsmuster der einzelnen Verbindungen sind rechts abgebildet. Über den Strukturen steht ein Tanimoto-Score von 0,98, über den Spektren ein Kosinus-Score von 0,24.
Daptomycin (oben) und sein Analogon (unten) haben verschobene Fragmentierungsmuster, obwohl sie sich generell sehr ähnlich sind. Ein Kosinusvergleich würde einen niedrigen Wert ergeben und nicht aufzeigen, dass es sich um sehr ähnliche Strukturen handelt.
  • Hohe strukturelle Ähnlichkeit: Die Struktur des Analogons (unten) ähnelt immer noch sehr stark der unveränderten Variante: Daptomycin (oben). 
  • Geringe spektrale Ähnlichkeit: Die Modifikationen im Analogon wirken sich auf mehrere Fragmente aus und verschieben einige der massenspektralen Peaks. Es verbleiben daher nur wenige überlappende Peaks, sodass der Wert für die spektrale Ähnlichkeit niedrig ausfällt.

Wenn deine Probe ein Daptomycin-Analogon enthält, würdest du weder bei einer Bibliotheks- noch bei einer Analogsuche einen Treffer erhalten. Obwohl sich in der Bibliothek ein eindeutiges Referenzspektrum befindet! 

Verlässt du dich also ausschließlich auf die Kosinusähnlichkeit, dann

  • kannst du dir nicht sicher sein, dass die Übereinstimmungen mit dem höchsten Kosinuswert wirklich die besten strukturellen Übereinstimmungen sind. 
  • könnte deine Bibliothek einen exakten Treffer enthalten, den du aber wegen des geringen Kosinuswertes nicht finden würdest.

Um dieses Problem zu lösen, haben Florian Huber und sein Team einen Weg gefunden, strukturelle Ähnlichkeit direkt anhand von Tandem-Massenspektren vorherzusagen.

Wie MS2DeepScore strukturelle Ähnlichkeit vorhersagt

MS2DeepScore stellt fest, ob es sich bei Verbindungen um eng verwandte Strukturanaloga handelt. Es findet auch dann Treffer, wenn andere Vergleichsmethoden wie die Kosinusähnlichkeit scheitern. 

Florian Huber und sein Team trainierten MS2DeepScore auf Basis von mehr als 100.000 Spektren von über 15.000 verschiedenen Verbindungen. Nach dem Training berechnet das MS2DeepScore-Modell die Tanimoto-Ähnlichkeitsscores zweier Verbindungen direkt aus ihren jeweiligen MS/MS-Profilen. 

MS2DeepScore schneidet bei der Zuordnung strukturell ähnlicher Verbindungen konstant besser ab als die Kosinusähnlichkeit und Spec2Vec, selbst wenn die Fragmentierungsprofile der Verbindungen verschoben sind. Die Verbindungen, für die die Treffsicherheit der Scores verglichen wurde, waren nicht im MS2DeepScore Trainingsdatensatz enthalten.

Ein Diagramm, das die Präzision gegenüber der Trefferquote für vier Vergleichsalgorithmen zeigt, die strukturell ähnliche Verbindungen anhand ihrer Spektren vergleichen. 
MS2DeepScore übertrifft Kosinus-Scores und Spec2Vec in seiner Treffsicherheit

In unserem Beispiel betrug der Kosinuswert zwischen Daptomycin und unserem Analogon nur 0,24. Bei diesem Wert würden wir davon ausgehen, dass sich diese Verbindungen strukturell nicht besonders ähnlich sind. Das MS2DeepScore-Modell sagt jedoch einen Tanimoto-Wert von 0,95 voraus, was fast dem tatsächlichen Tanimoto-Wert von 0,98 entspricht.

MS2DeepScore einsetzen

Der Einstieg in MS2DeepScore ist einfach, sodass du innerhalb weniger Minuten deine ersten Spektren vergleichen kannst. 

Du kannst MS2DeepScore unabhängig davon verwenden, mit welchem Messinstrument du arbeitest. MS2DeepScore nutzt das matchms Modul, du kannst also verschiedene Open Source Formate wie .mgf, .mzxml und .mzml verwenden. 

Florian und sein Team haben MS2DeepScore als ein Python Package veröffentlicht, inklusive Jupyter Notebook Tutorials für den Einstieg. Du kannst mit einem Modell beginnen, das auf Basis von 109.000 Spektren von 15.000 Verbindungen trainiert wurde. Mehr Infos über MS2DeepScore und seine Entstehung findest du in der Preprint-Publikation.

Wie geht es mit MS2DeepScore weiter?

Wir entwickeln aktuell weitere Möglichkeiten zum Einsatz von MS2DeepScore, einschließlich einer API, einer benutzerfreundlichen Schnittstelle und neuen Modellen. 

Diese neue Version enthält:

  • Ein neues Modell, trainiert auf über 230.000 Spektren;
  • Bibliotheksvergleiche mit öffentlichen GNPS-Datenbanken;
  • Ein neues Modell für Spektren aus Negativ-Modus Messungen.

Wenn du die neue Version gerne testen würdest, kontaktiere uns für einen Beta Zugang.

Bekomme immer die neusten Artikel

Trag dich mit deiner E-Mail ein, um du bekommst jede Woche unseren neusten Artikel.

Ich danke Ihnen! Ihre Einreichung ist eingegangen!
Oops! Something went wrong while submitting the form.