Churn Prediction mit Machine Learning

Alle Unternehmen im Konsumgütermarkt und im Enterprise Bereich müssen sich mit Kundenabwanderung auseinandersetzen, da sie sich letztendlich auf die Umsatzzahlen des Unternehmens auswirken und damit die strategischen Entscheidungen beeinflussen könnte.

Laut den Autoren von „Leading on the Edge of Chaos“ entspricht eine Erhöhung der Kundenbindung um 2% (oder eine Verringerung der Abwanderung) einer Kostensenkung um 10%. Kein Wunder also, dass SaaS-Unternehmen (und Unternehmen, die sich um Kunden kümmern) der churn prediction (auf deutsch: Abwanderungsanalyse) große Aufmerksamkeit schenken. Zusätzlich ist es laut diverser Quellen 6-7 mal teurer, einen neuen Kunden zu gewinnen, als einen alten zu behalten.

„Es gibt nur zwei Quellen von Wettbewerbsvorteilen, die Fähigkeit, mehr über unsere Kunden schneller als die Konkurrenz zu erfahren, und die Fähigkeit, dieses Lernen schneller als die Konkurrenz in die Tat umzusetzen“.
– Jack Welch, ehemaliger Vorstandsvorsitzender und CEO von General Electric

Customer Churn bezieht sich auf die Rate der Kundenabwanderung in einem Unternehmen oder in einfacheren Worten auf die Geschwindigkeit, mit der der Kunde Ihr Unternehmen oder Ihre Dienstleistung verlässt. Beispiele für Kundenabwanderungen sind unter anderem

  • Kündigung eines Abonnements
  • Schließung eines Kontos
  • Nichtverlängerung eines Vertrages oder einer Dienstleistungsvereinbarung
  • Entscheidung, in einem anderen Geschäft einzukaufen
  • Einen anderen Dienstleister verwenden

Churn kann aus vielen verschiedenen Gründen auftreten und die Churn-Analyse hilft, die Ursache (und den Zeitpunkt) dieser Churn zu identifizieren, was Möglichkeiten eröffnet, effektive Kundenbindungstrategien  umzusetzen. Hier sind 6 bewährte Schritte, um sicherzustellen, dass Sie sich auf die Bindung Ihrer Kunden konzentrieren – wir werden uns nur auf Schritt 2 und Teile von Schritt 3 für diesen Artikel konzentrieren. Dabei geht es nicht darum, das Produkt oder die sonst jemanden für die Abwanderung verantwortlich zu machen, sondern den Kunden besser zu verstehen und eine Strategie zur Verbesserung der Kundenbindung zu entwickeln.

  1. Erfassung von Kundenverhalten, Transaktionen, demographischen Daten und Nutzungsmustern
  2. Verwenden Sie diese Datenpunkte, um Kundensegmente vorherzusagen, die wahrscheinlich abwandern werden
  3. Erstellen Sie ein Modell, um die Risikotoleranz des Unternehmens in Bezug auf die Abwanderungswahrscheinlichkeit zu modellieren
  4. Entwicklung eines Interventionsmodells, um zu untersuchen, wie sich das Ausmaß der Intervention auf die Churn-Prozentsätze und den Customer Lifetime Value (CLV) auswirken könnte
  5. Implementieren Sie effektive Experimente in mehreren Kundensegmenten, um die Abwanderung zu reduzieren und die Bindung zu fördern
  6. Iterieren Sie diesen Prozess (kognitives Churn-Management ist ein kontinuierlicher Prozess und nicht einmal im Jahr eine Übung)

Wir glauben auch, dass der Ansatz der Risikoanalyse – Entscheidungsfindung – Marketing-Segmentierung eine generische Struktur ist, die für viele Geschäftsprobleme und nicht nur für die Churn-Analyse verwendet werden kann.

Ein prädiktives Churn-Modell ist ein einfaches Klassifikationstool: Schauen Sie sich die Benutzeraktivität aus der Vergangenheit an und überprüfen Sie, wer nach einer bestimmten Zeit aktiv ist, und erstellen Sie dann ein Modell, das probabilistisch die Schritte und Phasen identifiziert, in denen ein Kunde (oder Segment) Ihre Dienstleistung oder Ihr Produkt verlässt.

Ein prädiktives Churn-Modell gibt Ihnen das Bewusstsein und quantifizierbare Kennzahlen, mit denen Sie bei Ihren Bemühungen zur Kundenbindung arbeiten können. Dies gibt Ihnen die Möglichkeit, die Gewohnheiten von Kunden zu mustern und einzugreifen, bevor sie die Entscheidung treffen. Ohne dieses Tool würden Sie nach allgemeinen Annahmen handeln, nicht nach einem datengesteuerten Modell, das widerspiegelt, wie sich Ihre Kunden wirklich verhalten.

Ohne ein tiefes Verständnis Ihrer Kunden und ihres Verhaltens ist es schwierig, sie zu halten, daher ist der erste Schritt bei der Erstellung dieses Modells das Verständnis Ihres Kundenverhaltens aus Kundendatenpunkten. Welche Art von Daten benötigen wir um die Auslöser zu identifizieren, die dazu geführt haben, dass sie Ihr Unternehmen letztlich verlassen haben.

Kundeninformationen

  • Postleitzahl
  • Einkommensklasse
  • Geschlecht
  • Beruf
  • Haben sie Kinder im Haushalt?
  • Wie finden sie Ihre Website / Ihr Produkt?
  • Öffnen sie Ihre Newsletter und andere Trigger-E-Mails oder klicken sie auf irgendwelche Links?

Produkte

  • Art des Produkts
  • Produktvielfalt
  • Gutscheinverwendung
  • Produktpräferenzen oder Kombinationen

Kaufhistorie

  • Häufigkeit des Kaufs
  • Datum des letzten Kaufs
  • Tageszeit/Saison des Kaufs
  • Wert der Einkäufe
  • Zahlungsmethoden
  • Guthaben / Filialguthaben

Kundeninteraktionen

  • Servicefragen
  • Shop-Besuche / Online
  • Beschwerde Auflösung
  • Priorität der Reklamation
  • Wie beschweren sie sich – E-Mail oder Telefon oder Twitter?
  • Häufigkeit der Beschwerden

Dies sind nur einige Beispiele um loszulegen. Es ist wichtig, so viel wie möglich über unsere Kunden zu wissen, um zu wissen, welches Ereignis sie zum Ausscheiden und zur Suche nach dem nächsten Wettbewerber führt. Je mehr relevante Daten Sie sammeln, desto genauer wird Ihr Modell sein. Sobald Sie diese Kundendaten in einer zentralen Datensenke gesammelt und die Analyse gestartet haben, werden Sie Trends erkennen, die Ihnen Einblicke in die Kundenabwanderung geben. Die konsolidierten Daten aller Abwanderer helfen Ihnen auch, das Verhalten zu gruppieren und Muster festzulegen.

DATENAUFBEREITUNG
Sobald Sie genügend Daten für Ihre Analyse gesammelt haben, ist der nächste Schritt die Datenaufbereitung. Dies ist der zeitaufwändigste, aber wichtige Schritt in der Datenanalyse. Wie das berühmte Sprichwort sagt: „Garbage In, Garbage Out“. Ihre Analyse wird so gut wie die Daten, auf denen sie basiert.

Sie können diese drei Kriterien verwenden, um eine gute Datenqualität zu gewährleisten:

  • Vollständig
  • Sauber
  • Genau

Komplett – Haben Sie alle relevanten Dimensionen? Wie viel Prozent der Daten haben fehlende Werte oder Nullen? Sie können einige der fehlenden Werte durch Datenexploration ausfüllen, z.B. Werte von ‚Bundesland‘ basierend auf der Kundenadresse oder ‚Produkt Kategorie‘ basierend auf der Artikelnummer usw.

Sauber – Haben Sie mehrere Werte für die gleiche Dimension? z.B. NRW/Nordrhein-Westfalen/Nordrhenwestfalen; verschiedene Abkürzungen für einen Produktnamen etc. Wenn ja, können Sie eine Datenbereinigung durchführen, um die Einheitlichkeit zu gewährleisten.

Genau – Gibt es für einige Transaktionen negative Erlöswerte oder €0 Erlöse?; Datumskonflikte; ‚NONE‘ oder ‚N/A‘ Werte etc. Sie können nach Rücksprache mit den Stakeholdern entscheiden, ob Sie solche schlechten Daten in die Analyse aufnehmen oder ausschließen möchten.

In der vorhersagenden und diagnostischen Analytik gibt es einen weiteren Schritt in der Datenaufbereitung – die Erstellung der Zielvariablen. Falls die Churn-Analyse durchgeführt wird, könnte es sich um eine binäre Spalte wie „wird kündigen?“ handeln. Sie können die Werte für diese Variable eingeben, indem Sie die historischen Daten analysieren. Z.B. ein Wert von 1/TRUE für Kunden, die ihr Abonnement gekündigt haben und 0/FALSE für diejenigen, die es verlängert haben.

EXPLORATIVE ANALYSE

*Beispielhafte Implementierung am Ende des Artikels*.

Im Gegensatz zur traditionellen, statistischen Modellierung (wie linear regression) werden maschinell lernende, predictive Modelle durch einen Computeralgorithmus erzeugt. Eine entscheidende Fähigkeit für den Aufbau des Churn-Modells ist es, so viele Fragen wie möglich stellen zu können. Auf diese Weise können Sie Ihre Annahmen und Daten testen, erneut testen und qualifizieren, bevor Sie zur Implementierung eines Modells übergehen. Hier sind einige grundlegende Fragen, um loszulegen.

1. Welcher Grad der Korrelation zwischen den verfügbaren Datenpunkten und der Fluktuation ist gegeben?

Aus dieser Frage lässt sich eine Antwort ableiten wie „von allen Kunden, die im letzten Quartal gegangen sind, 80% von ihnen haben am Wochenende eine Beschwerde eingereicht“, oder „von allen Kunden, die in den letzten zwei Quartalen gegangen sind, haben 56% von ihnen die Reporting-Tools in unserer Software nie benutzt“. Ihr Ziel ist es, diese explorative Frage zu nutzen, um ein oder mehrere Korrelationsmuster in bestimmten Datenpunkten zur Fluktuation aufzudecken. Während Sie dabei sind, stellen Sie auch die gleichen Fragen für aktuellen Kunden und sehen Sie, ob Ihre allgemeinen Annahmen wahr sind oder ob es sich nur um zufällige Hinweise handelt. Wenn Ihre Annahmen wahr sind, haben Sie einen Trend entdeckt, der Aufmerksamkeit erfordert.

Die Verwendung von Modellen des maschinellen Lernens kann Ihnen auch einige Zusammenhänge aufzeigen, die für den menschlichen Analysten normalerweise unsichtbar sind.

2. In welcher Phase im Produktlebenszyklus haben die Kunden gekündigt?

Wann sind diese Kunden gegangen? Am Ende der ersten Testphase, wenn das Abonnement abgelaufen ist, oder war eine Funktion zu schwierig zu bedienen oder handelt es sich um ein externes Ereignis? Wie lange haben sie unsere Software benutzt, bevor sie gegangen sind? Haben sie einen Anruf beim Kundendienst gemacht und sind unzufrieden geblieben? Welche sind einige der wichtigsten Trends für die Kunden, die ihr Abonnement nicht verlassen und verlängert haben?

Erforschen Sie weiterhin jeden einzelnen Datenpunkt und seine Verhältnisse – maschinelle Lernmodelle machen dies in der Regel deutlich besser als Menschen und finden unerwartete Muster.

3. Welche Auswirkungen haben die verschiedenen Kundensegmente auf den Lifetime Value (LTV)?

Das Ergebnis eines guten Modells ist es, Auslöser und Verhaltensweisen zu finden, die gleichbedeutend sind mit einer Erhöhung der Abwanderung oder einer erhöhten Retention und einem Rückgang. Wenn zum Beispiel jeder Kunde in einem bestimmten Segment einen LTV von 100 € hatte und Ihr Modell zeigt, dass X von ihnen weggehen, dann können Sie leicht die negativen Auswirkungen auf die Umsatzzahlen aufgrund dieser Abwanderung hervorheben und Geschäftsführern helfen, die Kundenbindungsstrategien zu quantifizieren und zu priorisieren.

Was kommt nach der Analyse
Wenn Sie nicht mindestens drei hoch korrelierende Attribute finden können, stellen Sie nicht die richtigen Fragen zu Ihren Daten oder haben vielleicht nicht die richtigen Datensätze.

Sobald Sie die Kundensegmente und deren Verhalten, die zu Abwanderung führen identifiziert haben, können Sie Empfehlungen für Ihr Team erarbeiten, um die Kundenbindung zu erhöhen. Das Entwerfen, Implementieren und Ableiten von Ergebnissen aus intelligenten Experimenten ist ein Thema eines anderen Artikels, aber hier sind einige schnelle Ideen:

Für ein Telekommunikationsunternehmen, das Abwanderungen von einkommensstarken Bevölkerungsgruppen beobachtet, die mehr Textnachrichten als tatsächliche Telefonate nutzt kann ein Nischen Plan erstellt werden, der auf dieses Segment ausgerichtet ist.

Für einen Online-Projektmanagement-Service, bei dem ein schneller Kundenrückgang während der Testphase zu verzeichnen ist, kann es sinnvoll sein, während der Einarbeitung neuer Kunden explizite Schulungen anzubieten, um die Testphase noch interessanter zu gestalten.