5 Hindernisse in KI-Projekten

Or Hiltch – KI für Immobilieninvestments und darüber hinaus

by
DataRevenue
Gareth Dwyer

Wir haben uns mit Or Hiltch zusammengesetzt, dem Co-Founder und CTO von Skyline AI, um uns mit ihm über den Einsatz von Machine Learning zur Wertsteigerung von Immobilienportfolios zu unterhalten.

Er schildert die häufigsten Fehler, die Unternehmen immer wieder begehen und erklärt, wie sie sich vermeiden lassen:

  • Man muss begreifen, worum es bei Machine Learning geht,
  • Sich gründlich mit den eigenen Daten auseinandersetzen und
  • Sich gut überlegen, ob sich ein firmeninternes Machine Learning Team lohnt.

Or's Werdegang

Im Alter von 13 Jahren brachte Or sich Programmieren selbst bei und hat seitdem nicht mehr damit aufgehört. Obwohl seine Karriere in renommierten Firmen begann, gründete er schon bald sein eigenes Unternehmen: Über Sequoia Capital beschaffte er Gelder für ein Vorgängerprojekt, RailStream, sowie erneut für sein aktuelles Unternehmen, Skyline AI. Dort leitet er Machine Learning Teams bei der Entwicklung von intelligenter Investmentmanagement-Software in der Immobilienbranche.

Or wurde als AWS Community Hero für seine Blogposts und sein Engagement ausgezeichnet. Auch mit uns teilte er großzügig sein Wissen, angefangen bei gängigen Fehlern, die er immer wieder beobachtet, bis hin dazu, wie er überprüft, ob Machine Learning Lösungen tatsächlich funktionieren.

Häufige Hindernisse für Unternehmen, die Machine Learning adaptieren.

Es gibt (bisher) noch kein Handbuch zur Orientierung für Unternehmen, die gerade damit beginnen, Machine Learning Lösungen zu entwickeln. Or hat bereits mit zahlreichen Managern - sowohl auf technischer als auch nicht-technischer Ebene - zusammengearbeitet und kennt die gängigsten Fehler, die aufgrund mangelnder Orientierungshilfen entstehen:

“Es gibt wirklich kein Lehrbuch darüber, wie man KI auf Unternehmensebene einführt. Man findet viele gute Tutorials, um als Entwickler oder Wissenschaftler in Machine Learning einzusteigen, aber kaum etwas auf Unternehmensebene.”

Or hat jedoch ein paar wertvolle Expertentipps, um dabei helfen, die häufigsten Fehler zu vermeiden.

Stolperstein 1: Machine Learning vs KI – Was ist der Unterschied?

Die Begriffe Machine Learning (ML) und Künstliche Intelligenz (KI) werden oft synonym verwendet. Streng genommen ist Machine Learning ein Teilbereich von KI. Die Tatsache, dass die Begriffe unterschiedlich verwendet werden, ist bei der Adaption von Machine Learning nicht gerade hilfreich.

Or musste feststellen, dass Unternehmen häufig schlichtweg betonen, dass sie “KI einsetzen”, um Hype und Aufmerksamkeit für ihr Produkt zu erregen. Aber es ist nicht immer sinnvoll, jegliche Automatisierung als KI zu bezeichnen. Man denke zum Vergleich an den Autopiloten eines Flugzeugs: Autopiloten sind eine serienmäßige Standardausstattung, die es schon seit Jahrzehnten gibt.

“Ein Autopilot erledigt heutzutage die meiste Arbeit, sogar die Landung. Aber es ist seit vielen Jahren ein serienmäßiges Standardprodukt. Früher sprach man von einem heuristischen Algorithmus, oder schlicht von Automatisierung. Würde aber heute ein Unternehmen einen Autopilot entwickeln, würden sie es wahrscheinlich als KI bezeichnen.”

Die Vermischung der beiden Begriffe ist so alltäglich, dass Ors Team immer wieder darüber scherzt: 

“Was ist der Unterschied zwischen Machine Learning und KI? “Ist es Code, dann geht es um Machine Learning – ist es eine Powerpoint Präsentation, dann ist es KI

Stolperstein 2: Eigene Datensätze sind in der Regel nicht groß genug

Die meisten Unternehmen, mit denen Or zusammengearbeitet hat, verfügen über eine interne Daten, aus denen sie mit Hilfe von Machine Learning Informationen gewinnen möchten. In den meisten Fällen sind aber Datensätze, die von einzelnen Unternehmen gesammelt wurden, nicht groß genug um Machine Learning für Prognosen einzusetzen (mit kleineren Datensätzen können aber trotzdem noch andere brauchbare Analysen durchgeführt werden).

“Angenommen, es handelt sich um einen großen Vermögensverwalter mit Hunderten von Immobilien. Mehrere hundert Immobilien sind eigentlich ziemlich nützlich für alle möglichen Arten von Analysen, aber nicht für Machine Learning. Man benötigt Hunderttausende von Immobilien, um Machine Learning Algorithmen einsetzen zu können".

Selbst wenn man Daten aus größeren, öffentlichen Datensätzen hinzufügt, kann es immer noch schwierig sein, diese effektiv zu nutzen. Obwohl Machine Learning Algorithmen oft als "intelligent" bezeichnet werden, benötigen sie immer noch Menschen, die die ersten Zusammenhänge zwischen den Daten herstellen.

[Als erster unsere neue Artikel bekommen? Abonnier unseren Newsletter. Jede Woche eine wertvoller Artikel. Kein Spam.]

Stolperstein 3: Die Datensätze müssen nicht nur groß, sondern auch bereinigt und gut strukturiert sein

Reine Masse ist nicht alles, und Machine Learning Experten sprechen oft von “GIGO” – “Garbage in, garbage out” –  um zu betonen, dass aus schlechten Daten keine guten Ergebnisse entstehen können.

Laut Or unterschätzen Unternehmen oft, wie viel manuelle Bereinigungs- und Aufbereitungsarbeit an ihren Datensätzen vorgenommen werden muss, bevor sie für Machine Learning eingesetzt werden können. Wenn die Daten nicht einheitlich gekennzeichnet und strukturiert sind, können Machine Learning Algorithmen keine sinnvollen Zusammenhänge herstellen:

“In der Immobilienbranche ist das eine enorme Herausforderung. Es gibt keinen einzigen Datensatz, der alle benötigten Daten enthält. Bevor man also überhaupt zur Analyse - geschweige denn zum Machine Learning - kommt, muss dieser Datensatz erstmal erstellt werden.”

Or betont außerdem, dass häufig unterschiedliche Standards in der Erstellung von Datensätzen verwendet werden, was eine weitere Herausforderung für Machine Learning darstellt. Oft wird dieselbe Immobilie auf zwei verschiedene Arten gekennzeichnet, wodurch der Algorithmus sie erst einmal als zwei unterschiedliche Immobilien versteht.

Ein paar zusätzliche Monate im Zeitplan reichen leider für den Prozess der Datenaufbereitung oft nicht aus. Or und sein Team von 15 Entwicklern brauchten fast 2 Jahre, um ihre Daten zu bereinigen und zu strukturieren.

“Wir waren 15 Entwickler und haben fast 2 Jahre damit verbracht, unser Data Warehouse zu erstellen. Hierzu mussten wir einen sogenannten Entity-Resolution-Algorithmus entwickeln, der die verschiedene Datensätze der Immobilien, die wir beobachten, mit einbezieht. Wir müssen die Informationen aus verschiedenen Quellen für jede einzelne Immobilie kombinieren, um sicherzustellen, dass der finale Datensatz stimmt. Eine Immobilie ist in verschiedenen Quellen unter Umständen mit unterschiedlicher Adresse oder unterschiedlichem Namen eingetragen.”

Und wenn man dann über bereinigte, große Datensätze verfügt, benötigt man außerdem das nötige Fachwissen, um diese Daten zu nutzen:

Stolperstein 4: Ein firmeneigenes Machine Learning Team zusammenzustellen ist oft schwieriger, als Manager erwarten

Ein weiterer Fehler, den Unternehmen häufig begehen, liegt darin, hauptsächlich PhDs, Statistiker und Mathematiker im Machine Learning Team einzustellen. Wissenschaftler, die jahrelang an neuen Algorithmen forschen, erzielen zwar bei Unternehmen wie Google, Facebook und Amazon enorme Erfolge, dies geschieht jedoch vor allem in Zusammenarbeit mit Entwicklern. Tatsächlich benötigt die Mehrheit der Unternehmen hauptsächlich Machine Learning Entwickler und keine Data Scientists.

Ein Machine Learning Team zusammenstellen

Or beschreibt das ideale Machine Learning Team als Kombination aus Machine Learning Entwicklern, Data Scientists, Front-End-Ingenieuren, Designern, UX-Experten und Produktmanagern.

Wie Design, Produkt, Entwicklung und Forschung in einem Machine Learning Team zusammenspielen.
Ein Machine Learning Team sollte nicht nur aus Wissenschaftlern bestehen. Ausschlaggebend für den Erfolg sind vor allem Softwareentwickler. 

Als Ausgangspunkt benötigt man Entwickler, die eine stabile und skalierbare  Dateninfrastrukturen bauen können.

“Man braucht Machine Learning Entwickler oder Data Engineers. Sie sind darauf spezialisiert, Datenpipelines oder Datenanwendungen zu entwickeln, die die vorhandenen Daten fortlaufend und zuverlässig aufbereiten. Diese Pipelines müssen überwacht werden und in hohem Maße skalierbar sein.”

Front-End-Entwickler und Designexperten

Auch wenn ein System hauptsächlich intern verwendet wird, ist die Benutzerfreundlichkeit äußerst wichtig. Viele Unternehmen ignorieren diesen Aspekt und erhalten am Ende eine leistungsfähige Lösung, die jedoch wenig genutzt wird.

“Man braucht auch Front-End Entwickler. Man benötigt Designer, die das System gestalten. Und man braucht UX-Designer, die die Funktionalität der Plattform konzipieren.”

Data Scientists

Etwas theoretische Arbeit ist in der Regel ebenso notwendig. Data Scientists sind in keinster Weise überflüssig, aber sie brauchen in der Regel die Unterstützung guter Entwickler:

Wenn die Daten bereits im Data Warehouse sind dann können Data Scientists anfangen mit den Daten zu arbeiten. Am Ende überführen Entwickler dann wieder die Erkenntnisse der Data Scientists in die endgültige Lösung." 

Produktmanager

Abgesehen davon, dass die Arbeit der Entwickler qualitativ stimmen muss, muss gleichzeitig sichergestellt werden, dass sie überhaupt das Richtige entwickeln. Hier kommen die Projektverantwortlichen ins Spiel:

“Manchmal können der CTO, der VP of R&D (research and development) oder der CEO diese Rolle übernehmen. In der Regel gibt es aber ein oder zwei Personen, die letztendlich dafür verantwortlich sind zu prüfen, was entwickelt werden soll."

Da es sehr schwierig sein kann, ein eigenes Machine Learning Team zusammenzustellen, ist es manchmal besser, eine externe Beratungsagentur zu konsultieren: So arbeitet man mit einem Team, dass sich mit genau diesen Problemstellungen bereits bestens auskennt. 

Lohnt sich ein internes Machine Learning Team?

Auch wenn es immer häufiger vorkommt, dass weniger IT affine Unternehmen ihr eigenes internes Software-Entwicklungsteam haben, ist es seltener sinnvoll, ein eigenes Machine Learning Team zusammenzustellen. Machine Learning Fachwissen ist zwar an sich sehr wertvoll, solange es jedoch nicht zum Kern des eigentlichen Serviceangebots eines Unternehmens gehört kann es schnell zu einer teuren Nebenbeschäftigung werden. Beispielsweise benötigen viele Unternehmen eine Art Suchfunktion; abgesehen von Google lohnt es sich aber für kaum ein Unternehmen eine eigene eigene Suchalgorithmen zu entwickeln.

“Es wäre für die meisten Unternehmen unsinnig, einen Suchalgorithmus zu entwickeln, der mit Google mithalten soll. Das wäre völlig absurd. Genauso ist der Versuch, ein eigenes internes Data Warehouse zu entwickeln und dann ein Machine Learning Modell zu entwickeln ein ziemlich großes Risiko, solange es nicht zum Kerngeschäft gehört.”

Gerade weil es kein Handbuch für die Umsetzung von Machine Learning gibt, ist es oft sinnvoll, sich auf Experten zu verlassen, die jegliche Fehler bereits mindestens einmal selbst gemacht haben und wissen, wie man sie vermeidet.

Stolperstein 5: Machine Learning ist schnell, manche Branchen jedoch sehr langsam

Manager gehen oft davon aus, dass sie, sobald sie ihr Machine Learning Modell haben, direkt auch Nutzen daraus ziehen können. Dies ist zwar in schnelllebigen Branchen wie der Finanzbranche der Fall, nicht aber in "langsameren" Branchen wie der Immobilienbranche. Ein Haus wird über viele Jahrzehnte hinweg oft nur ein- oder zweimal verkauft, was einen starken Kontrast darstellt zu beispielsweise der Börse, an der Anteile oft mehrmals täglich den Besitzer wechseln. Or hat zuvor auch im Finanzwesen gearbeitet hat, und sieht den Kontrast:

“Der Aktienmarkt ist in gewissem Sinne prädestiniert für Modellierung. Man verfügt über alle möglichen Daten und kann mehr oder weniger direkt starten. Laptop hochfahren und Prognosemodelle programmieren - da man alles direkt verfügbar hat, fängt man an Tag 1 direkt an.”

Unternehmen der "Internetindustrie", z.B. Facebook, sind ähnlich agil:

“Ein Data Scientist bei Facebook kann beispielsweise die Aufgabe bekommen, den Newsfeed so anzuordnen, dass die Kennzahl "Likes pro Sekunde" zunimmt. Das Ziel besteht darin, den Feed interessanter zu gestalten, sodass mehr Likes entstehen. Sobald das Team ein Modell trainiert hat, kann es direkt im Anschluss die Performance des Modells messen.”

Die Immobilienbranche verhält sich da jedoch ganz anders. Es dauert länger, um aus Modellen Nutzen zu ziehen, man muss sorgfältiger mit den eingespeisten Daten umgehen, und es ist schwieriger zu überprüfen, wie gut die Ergebnisse tatsächlich sind.

Um dem entgegenzuwirken, setzt Or drei verschiedene Ansätze zur Verifizierung ein.

  • Verifizierung über Rendite: Dies ist die stärkste Form der Verifizierung. Wenn der Einsatz der Machine Learning Lösung zu einer besseren Investitionsrendite führt, ist das ein deutliches Zeichen dafür, dass sie funktioniert. Diese Art der Verifizierung kann sich jedoch über Jahrzehnte hinziehen.
  • Verifizierung über Backtesting: Verfügt man über genügend Daten, kann man das Modell anhand eines Teils der Daten trainieren und seine Funktionsfähigkeit anhand der restlichen Daten testen. Or erklärt: "Nehmen wir an, man trainiert ein Modell anhand von Daten aus den letzten drei Jahren und lässt es dann Vorhersagen für dieses Jahr machen. Auf diese Weise erkennt man, wie genau das Modell tatsächlich ist.” Or warnt jedoch davor, dass diese Methode nicht immer zuverlässig ist: "Es kann immer sein, dass etwas schief gelaufen ist und das Modell “overfitted” ist, oder dass es Probleme mit der Benchmark gibt. Deswegen sollte man hier sehr sorgfältig vorgehen. Diese Arbeit sollte am besten immer die erfahrensten Data Scientists durchführen.”
  • Verifizierung über Konsens: Stehen einem weder genug Zeit noch genügend Daten zur Verfügung, müssen menschliche Experten die Vorhersagen des Algorithmus beurteilen. Aber auch das ist nicht ganz einfach: “In solchen Fällen - den am schwierigsten zu verifizierenden Algorithmen - muss das ganze Team eng zusammenarbeiten um die Qualität der Prognosen zu beurteilen.”

Die Post-COVID-Welt: Können sich Machine Learning Lösungen anpassen?

Machine Learning besticht durch seine Vielseitigkeit. Für die Krebserkennung, Übersetzung von Sprachen und um Tradern einen Vorteil am Markt zu geben können wir die gleichen Algorithmen eingesetzen. Die COVID-19-Krise hatte massive Auswirkungen auf den Immobilienmarkt, erklärt Or, was dazu führte, dass große Investitionsgeschäfte in vielen Teilen der Welt völlig ausbleiben.

Das bedeutet jedoch nicht, dass Machine Learning in der Immobilienbranche komplett stillsteht. Stattdessen können Lösungen, die ursprünglich für die effiziente Abwicklung einer großen Anzahl von möglichen Deals zu scannen, so angepasst werden, dass sie die wenigen guten Chancen in einem mageren Markt erkennen.

Or beschreibt, wie dieser Wandel abläuft:

“Der offensichtliche Wert jeder Art von Technologie - und besonders bei KI - lieget darin Prozesse zu skalieren”. Wenn jemand eine Lösung entwickelt, mit der 5 Analysten die Arbeit von 500 Analysten erledigen können, entsteht ein riesiger Vorteil, denn es gibt eine Menge Immobilien auf dem Markt.”
“Aktuell ist der Fluss an neuen Deals völlig versiegt. Und genau hier kann Künstliche Intelligenz Abhilfe schaffen, weil man sie anpassen kann, um proaktiv Chancen außerhalb des Marktes zu finden.”
“Mit einem Modell können wir vorhersagen welche Eigentümer und Immobilien wahrscheinlich bald zum Verkauf stehen und so nach wie vor eine Reihe von Deals abschließen, auch wenn die Anzahl öffentlicher ausgeschriebener Verkäufe im Grunde auf Null gesunken ist.“

Wie Lieferservices für Restaurants hilft KI Unternehmen Ihr Geschäft am laufen zu halten. Ohne Lieferdienste hätten Restaurants während des Lockdowns so gut wie keine Kunden. Aber Lieferunternehmen schaffen eine Nachfrage, die es unter normalen Umständen gar nicht gäbe:

“In gewisser Weise ist Machine Learning vergleichbar mit diesen Lieferdiensten. Auch wenn nichts öffentlich inseriert ist, kann man damit immer noch interessante Deals finden und Käufe abschließen.”
“Wir beobachten diese Art von Transaktionen aktuell, und in dieser Ära ist das ein wirklich interessantes Konzept.”

Die Vorstellung, Machine Learning Lösungen zu entwickeln kann sehr einschüchternd sein, aber wenn man sie gut umsetzt, verschaffen sie einem einen wichtigen Vorsprung. Selbst in Zeiten wirtschaftlicher Unsicherheit und globaler Krisen können gut gebaute Machine Learning Lösungen und gut aufbereitete Daten so angepasst werden, dass sie uns auf neue, ungeahnte Weise Wert schaffen.

Bekomme immer die neusten Artikel

Trag dich mit deiner E-Mail ein, um du bekommst jede Woche unseren neusten Artikel.

Ich danke Ihnen! Ihre Einreichung ist eingegangen!
Oops! Something went wrong while submitting the form.