Der Einsatz von Machine Learning zur Diagnose von Darmkrebs: Nathan Wan

Wir haben uns mit Nathan Wan von Freenome darüber unterhalten, wie er Machine Learning einsetzt, um Krebserkrankungen anhand von Blutproben zu erkennen.

Eine bewährte Methode, um Darmkrebs frühzeitig zu erkennen, ist die Darmspiegelung. Da es sich dabei aber um ein sehr invasives Verfahren handelt, lässt niemand gerne eine durchführen, ohne dass konkreter Verdacht besteht.

Im Rahmen von Vorsorgeuntersuchungen wird jedoch allen Patienten auch regelmäßig Blut abgenommen. Wäre es nicht praktisch, wenn wir die Ergebnisse einer Darmspiegelung auch durch einen viel einfacheren Bluttests bekommen könnten?

Genau mit diesem Thema beschäftigen sich Nathan und sein Team.

Nathans Hintergrund

Nathan hat Informatik und Elektrotechnik studiert und sich nebenbei auch mit Bioinformatik beschäftigt. Anschließend arbeitete er sechs Jahre lang in einem Machine Learning Team bei Google.

Nathan bekam jedoch Lust auf anspruchsvollere Herausforderungen und wechselte deshalb zu seiner jetzigen Position bei Freenome:

“Ich war auf der Suche nach einem Unternehmen, bei dem mich die Aufgabenstellung stärker herausfordert. Gleichzeitig ging es aber auch um den Impact des Unternehmens.”

Obwohl die Technologie im Mittelpunkt steht, hofft Nathan, dass seine Arbeit vor allem die Art und Weise beeinflusst, wie das Thema Gesundheit allgemein wahrgenommen wird:

“Wenn wir Erfolg haben, werden wir die allgemeine Einstellung zu Vorsorgeuntersuchungen grundlegend verändern. Ich sehe Potenzial für einen erheblichen Einfluss auf die gesellschaftliche Wahrnehmung unseres Gesundheitswesens.”

Darmkrebs und die Gefahren der Darmspiegelung

Fast 1 aus 20 Personen erkrankt im Laufe des Lebens an kolorektalem Krebs - allgemein bekannt als Darmkrebs.

Nathans Unternehmen hat eine Vision: Frühwarnzeichen von Darmrebs sollen anhand einer Standard-Blutprobe erkannt werden. Das würde eine Darmspiegelung nicht vollständig ersetzen, sondern im vorhinein Hinweise darauf liefern, ob eine Darmspiegelung als Folgeuntersuchung sinnvoll ist oder nicht.

Patienten wird oft geraten, alle 5 bis 10 Jahre eine Darmspiegelung als Routineuntersuchung durchführen zu lassen. Sollten Ärzte jedoch in der Lage sein, bereits anhand einer Blutprobe frühe Warnzeichen zu erkennen, könnten sie eine Darmspiegelung weitaus zielgerichteter als Diagnoseverfahren einsetzen.

Die Herausforderung liegt jedoch nicht nur in der technischen Umsetzung:

“Einige unserer Kontrahenten verwenden Stuhl- statt Blutproben. Dabei gibt es jedoch Bedenken, was sowohl die Genauigkeit des Verfahrens als auch die Compliance angeht: Patienten sind nicht immer bereit, Stuhlproben abzugeben und analysieren zu lassen.”

Krebsdiagnose durch Blutproben und Machine Learning

Nathans Team arbeitet an einem System, das anhand von Blutproben erkennt, ob ein Patient Risikoindikatoren einer Krebserkrankung aufweist.

In der Praxis ist das Ganze jedoch etwas komplizierter. Zusätzlich zur Blutprobe werden einige zusätzliche Daten benötigt, um zuverlässige Vorhersagen treffen zu können: Zum Beispiel, ob der Patient raucht, welche Medikamente er einnimmt oder ob er bereits Läsionen aufweist, die sich zu einer Krebserkrankung weiterentwickeln könnten.

Für die Daten, die aus dem Blut gewonnen werden, verwendet Nathans Team einen "multi-omischen" Ansatz:

“Das bedeutet, dass wir mehr als nur eine Art von Messung durchführen. Wir versuchen also nicht nur, die DNA zu analysieren, sondern gleichzeitig auch Proteine, die RNA oder andere Formen der molekularen Analyse.”

“Bei diesen Messungen werden also sowohl chemische Prozesse, als auch unterschiedliche Laborgeräte eingesetzt. Wir führen mehrere Messungen dieser Moleküle durch und kombinieren sie zu einem Machine Learning Modell, das am Ende eine Krebserkrankung erkennen soll.”

Der Weg zu einer präzisen und zertifizierten Datenpipeline

Im Vergleich zu seiner Arbeit bei Google, wo er seine Daten gestellt bekam und lediglich weiterverarbeiten musste, sind die Anforderungen in seiner derzeitige Rolle wesentlich umfangreicher.

Nathan muss sicherstellen, dass die Daten richtig erhoben werden, dass die richtigen Modelle trainiert werden und dass die Vorhersagen des Modells genau sind:

“Das Experiment-Design und die Datenerhebung haben einen viel größeren Einfluss auf die endgültige Brauchbarkeit eines Modells als der verwendete Algorithmus.”

Es hat sich außerdem als schwierig herausgestellt, alle benötigten behördlichen Genehmigungen zu erhalten:

“Unsere Pipeline ändert sich ständig, während wir gleichzeitig versuchen, sie bei der FDA einzureichen. Wenn sich das Modell ändert, ändert sich auch das Assay, und das wiederum beeinflusst die Pipeline.”

Sobald sich die Daten im Forschungssetting bewährt haben, werden sie an ein Entwicklerteam übergeben, um sie für die FDA vorzubereiten. Nathan betont den Unterschied zwischen Forschungs- und Produktionssettings:

“Niemals könnten wir der FDA den gesamten Code aus den Forschungsprojekten vorlegen und sagen: 'Bitte genehmigen Sie unser Produkt, wir hatten diese verrückte Idee, die dann aber nicht funktioniert hat.' Wir erstellen ein komplett eigenständiges System für die finale Version die wir einreichen. Dabei achten wir darauf, dass es im Produktionssystem keinerlei Abhängigkeiten von der Forschungsumgebung gibt.”

“Wir arbeiten sehr eng mit der FDA zusammen, um die relevanten Teile unserer Arbeit zu ermitteln und das Ganze übersichtlich zu halten. Es ist wie eine Forschungspräsentation. Im Hintergrund gibt es eine Menge Chaos, aber wir verwenden und präsentieren nur den Part, der sich bewährt hat.”

Die Arbeit in multidisziplinären Teams

Nathan arbeitet in einem gemischten Team aus Computational Biologists, Machine Learning Scientists, Statistikern und Forschern. So wird unterschiedlichstes Fachwissen miteinander kombiniert:

“Es gibt zum Beispiel Statistiker, die sich nicht so gut mit Python auskennen. Diese arbeiten dann mit jemandem zusammen, der Python besser beherrscht, und machen so schnellere Fortschritte. In unserem Team sind Leute aus dem akademischen Bereich, aus der Industrie, aus der Technik und aus der Biologie, also eine wirklich gute Mischung.”

Gleichzeitig kann es jedoch auch eine Herausforderung darstellen, mit so vielen unterschiedlichen Fachleuten effektiv zu arbeiten und sich auszutauschen. Nathan hat jedoch bereits Erfahrung mit interdisziplinärer Zusammenarbeit:

“Ich bin definitiv kein Experte auf den einzelnen Gebieten, man braucht aber zumindest genug Grundverständnis um die Perspektive der jeweiligen Experten zu verstehen. In meinen Augen ist das für jeden technischen Beruf wichtig, unabhängig davon ob es dabei um die Kommunikation mit Biologen, Chemikern oder Geschäftsführern geht.”

Overfitting und Bias erkennen

Machine Learning ist sehr leistungsstark, allerdings kann es leicht passieren, dass man die Aussagekraft der eigenen Modelle überbewertet:

“Wir verbringen sehr viel Zeit damit, unsere eigenen Ergebnisse zu hinterfragen. Ein Modell kann sich sehr leicht zu stark an einen Datensatz anpassen, wodurch es zu Overfitting kommt. Das wollen wir natürlich vermeiden. Außerdem fragen wir uns häufig: Wie identifizieren wir potenzielle Störfaktoren bzw. alles, was unsere Daten beeinflusst haben könnte, da wir nicht selbst an der Datenerhebung beteiligt waren?”

Menschliche Daten erheben und verarbeiten

Selbst wenn man alles richtig macht, ist die Arbeit mit biologischen Daten teuer. Nathan beschreibt es so:

“Die Datenerhebung mit menschlichen Proben - also Lebendproben - ist unglaublich teuer und auch relativ neu.”

“Ein großer Teil unseres Geldes fließt in die Probengewinnung. In meinen Augen ist das der schwierige Part der Biologie. Sobald man es mit menschlichen Versuchspersonen oder Patienten zu tun hat wird es immer etwas schwierig.”

Arbeitest du mit medizinischen Diagnoseverfahren?

Wir sind eine Machine Learning Agentur und spezialisieren uns auf die Entwicklung von Machine Learning Diagnostic Lösungen. Falls du mit ähnlichen Themen zu tun hast, würden wir uns gerne mit dir darüber austauschen. Vereinbare dafür jederzeit ein Gespräch mit uns.

Der Einsatz von Machine Learning zur Diagnose von Darmkrebs: Nathan Wan

Nathans Hintergrund

Darmkrebs und die Gefahren der Darmspiegelung

Krebsdiagnose durch Blutproben und Machine Learning

Der Weg zu einer präzisen und zertifizierten Datenpipeline

Die Arbeit in multidisziplinären Teams

Overfitting und Bias erkennen

Menschliche Daten erheben und verarbeiten

Arbeitest du mit medizinischen Diagnoseverfahren?

Weiterlesen

KI in der Medizin

Deep Learning in der H&E Färbung

KI in der Medizin

Deep Learning in der H&E Färbung

KI-Lektionen von Twitter, Pinterest and Amazon Music

Erfahren Sie, wie Machine Learning Ihr Unternehmen verändern kann.

Der Einsatz von Machine Learning zur Diagnose von Darmkrebs: Nathan Wan

Nathans Hintergrund

Darmkrebs und die Gefahren der Darmspiegelung

Krebsdiagnose durch Blutproben und Machine Learning

Der Weg zu einer präzisen und zertifizierten Datenpipeline

Die Arbeit in multidisziplinären Teams

Overfitting und Bias erkennen

Menschliche Daten erheben und verarbeiten

Arbeitest du mit medizinischen Diagnoseverfahren?

Bekomme immer die neusten Artikel

Weiterlesen

KI in der Medizin

Deep Learning in der H&E Färbung

KI in der Medizin

Deep Learning in der H&E Färbung

KI-Lektionen von Twitter, Pinterest and Amazon Music

Erfahren Sie, wie Machine Learning Ihr Unternehmen verändern kann.