Interview mit Lutz Finger zu Big Data "Wir wollen die Zukunft voraussagen"
Düsseldorf · Wenn Versicherungen soziale Netzwerke nutzen, um Rückschlüsse über Freunde zu ziehen und wie sich diese im Straßenverkehr verhalten, dann ist das keine Science Fiction. Schon heute nutzen Versicherungen in anderen Ländern Big Data um Fahrverhalten zu analysieren. Die Einsatzfelder von Big Data sind vielfältig - das Ziel ist oft gleich: Die Zukunft vorauszusagen, wie Datenspezialist Lutz Finger verrät.
In seinem neuen Buch "Ask Measure Learn" führt Lutz Finger in die spannende Welt von Big Data ein und erklärt, wie mit einer Analyse von sozialen Netzwerken das Kundenverhalten besser verstanden werden kann. Der Spezialist für Big Data beobachtet die neusten Trends für LinkedIn und hat im Gespräch mit unserer Redaktion eine Perspektive für den umgang mit vielen Daten aufgezeigt.
Herr Finger, was ist Big Data?
Lutz Finger Wenn man von Big Data spricht, meint man, dass es viele Daten gibt - beispielsweise über Kunden, ihre Bestellungen, ihr Verhalten, ihre Vorlieben. Und dass diese Daten in einer hohen Geschwindigkeit kommen. Es geht um mehrere Milliarden Datenpunkte pro Sekunde. Big Data bezeichnet aber auch sehr unterschiedliche Daten, die viel schwieriger zu erfassen sind als die, die in einer guten alten Excel-Tabelle strukturiert angeordnet sind. Wenn ich dort sauber die Geburtsdaten meiner Freunde aufgelistet habe, ist es einfach. Wenn ich aber nur Bilder habe und aufgrund von Hintergrund und Kleidung der Leute darauf schließen muss, wann die Bilder aufgenommen wurden, wird es wesentlich schwieriger. Das sind drei der Dimensionen von Big Data: Es können viele Daten sein, sie können schnell kommen und können unstrukturiert sein.
Aber wo genau kommen diese Daten denn her?
Finger Beispielsweise von Ihrem Auto. Oder von Ihrem Handy . Oder auch von Ihnen selbst. Nach und nach wird jedes Gerät um uns herum anfangen, Daten zu messen und zu speichern. Gesellschaftspolitisch spannend ist die Frage, wem diese Daten gehören. Diese Frage ist noch unzureichend geklärt. Die Autoindustrie wird beispielsweise sagen, dass dem Hersteller die Daten gehören, weil es ja das Auto ist, dass die Daten erhebt. Dass vielleicht Sie darin sitzen und fahren, und dass Sie das Auto gekauft haben - das ist eine andere Thematik.
Und wofür kann man all diese Daten nutzen?
Finger Das ist die vierte Dimension von Big Data: Wertschöpfung. Wir wollen die Zukunft voraussagen! Die Firmen, die Vorhersagen machen können, werden gewinnen. Vor 20 Jahren schon wussten Versicherungen beispielsweise, wie wahrscheinlich es ist, dass Sie ein guter oder schlechter Autofahrer sind. Wohnort, Alter, Geschlecht, Kinderzahl - diese Faktoren haben die Wahrscheinlichkeit beeinflusst und damit auch Prämie der Autoversicherung. Heute können wir viel mehr messen. Über soziale Netzwerke könnte die Versicherung sogar Rückschlüsse auf Ihre Freunde erhalten und analysieren wie diese sich im Straßenverkehr verhalten. Heute macht das noch keiner, aber in den USA und England gibt es schon Versicherungen die Ihr Fahrverhalten messen. Solche und ähnliche Daten werden in Zukunft die Versicherungsprämien bestimmen. Solche und andere Datenpunkte gab es früher nicht. Weder die Daten noch die Technologie, um mit ihnen zu arbeiten. Das verändert sich gerade und das meint die IT Branche, wenn sie über "Big Data" spricht. Es gibt neue und mehr Daten, die es Firmen ermöglichen, bessere Vorhersagen zu treffen.
Wenn Kundengeräte ungefragt Daten erheben, Bewegungsprofile der Menschen erstellt werden - ist nicht gesellschaftlicher Widerstand programmiert?
Finger Das ist die Frage danach, wie man mit den Daten umgeht. Die Geschichte zeigt uns, dass man Fortschritt nie wirklich aufhalten konnte. Wir haben durch Big Data die Möglichkeit erhalten Vorhersagen treffen können. Viele Leute sind Nutznießer dieser Vorhersagen, im täglichen Leben. Derjenige, der sich von seinem Navigationsgerät eine andere Route vorschlagen lässt und damit schneller zu Hause ist, weil das Gerät ermittelt hat, dass der übliche Weg jetzt höchstwahrscheinlich länger dauern würde - der freut sich ja, dass ein "predictive modeling" geholfen hat. Die Leute, die eine Suchmaschine nutzen, die freuen sich darüber, dass ihnen genau das vorgeschlagen wird, was sie finden wollten. Sie vergessen dabei allerdings, dass das auf ihren bisherigen Suchanfragen basiert. Wenn unsere Versicherung uns einen günstigeren Tarif gibt, weil wir ihr mehr Informationen über uns geben wie Anzahl der Kinder oder ob der Wagen in der Garage steht - mit all diesen Informationen sind Wahrscheinlichkeiten verbunden - dann sind wir in der Regel bereit, diese Daten her zu geben, weil wir dafür ja was kriegen. Was für die Gesellschaft schwierig ist: Sie kann derzeit noch nicht wissen, wie weitreichend diese Informationen sein könnten. Die gesellschaftliche Besorgnis ist deshalb berechtigt. Die Antwort kann nur Transparenz sein: Man muss von allen Institutionen, die Daten erheben, Transparenz verlangen - darüber, welche Daten erhoben werden und was mit ihnen geschieht.
Wenn all diese Daten zusammengeführt werden, dann ist das doch die vollständige Aufgabe der Privatsphäre. Werden die Menschen dagegen nicht Sturm laufen? Hilft da Transparenz?
Finger Zur Zeit sieht es so aus, als ob das durchaus auf gesellschaftliche Akzeptanz stößt. Wir unterschreiben blind die neuen AGB von iTunes oder anderen Online-Anbietern - kaum jemand liest sie sich vorher durch. Die Sorge, dass irgendwann irgendjemand etwas Schädliches mit den persönlichen Daten tun könnte, ist zur Zeit für viele nur eine nebulöse Sorge und nicht richtig greifbar. Und ihr gegenüber stehen die Vorteile, die wir durch die Abgabe von Daten haben. Wer wirklich keine Daten mehr hergeben möchte, muss harte Einschränkungen hinnehmen: Wir dürften keine Kreditkarten oder EC-Karten mehr benutzen. Wir müssten beim Surfen alle Skriptsprachen im Browser abschalten. Auch das Handy müsste aus bleiben. . Das Ergebnis wäre, dass wir auf fast alle Annehmlichkeiten des modernen digitalen Lebens verzichten müssten. Die Leute machen das nicht. Die meisten Leute haben das Datensammeln schon akzeptiert. Genau deswegen ist ein Dialog so wichtig.
Perspektivwechsel: Was müssen Unternehmen tun, um Big Data zu nutzen? Wo fangen sie an?
Finger Man muss die vorhandenen Daten zugänglich machen. Das bedeutet zunächst in Technik investieren. Das kommt nicht umsonst. Man muss Daten zentralisieren, an einem Punkt zusammenführen oder einen einfachen Zugang zu den Daten schaffen. Wenn man die Daten verfügbar hat, dann muss man sich Fragen überlegen, die man an die Daten stellen will. Eine gute Frage ist beispielsweise die nach den Kunden, denen ich jetzt, im Augenblick, am besten Werbung schicken kann: Für wen kommt mein derzeitiges Angebot zur rechten Zeit, so dass er die Werbung nicht als Belästigung ansieht, sondern als nützliche Information? Wenn das die Frage ist, dann muss man sich überlegen, welche Daten dafür notwendig sind. Und daraus kann man sich dann ein passendes Vorhersage-Modell bauen.
Ein guter Verkäufer macht das übrigens nicht anders: Der hat sein eigenes Vorhersagemodell, nämlich sein Bauchgefühl. Und wir fühlen uns ja sehr gut aufgehoben, wenn wir einen guten Verkäufer finden, der uns genau das vorschlägt, was wir gerade suchen. Wir ersetzen das Bauchgefühl jetzt durch die Analyse vieler Daten. Die Ergebnisse muss man dann einbauen in Prozesse wie beispielsweise Bestellvorgänge. Oder in Produkte. Es wird dabei aber ein Problem geben - allerdings nicht das der gesellschaftlichen Akzeptanz.
Sondern welches?
Finger Unsere Technikhörigkeit. Viele von uns glauben zu sehr an die Modelle. Was vernachlässigt wird ist die Tatsache, dass Modelle nur Wahrscheinlichkeiten geben. Nehmen Sie z.B. eine Telefonfirma. Die könnte ein sogenanntes Scoring-Modell bauen, um herauszufinden, wer ein guter und wer ein schlechter Kunde ist. Solche Modelle nutzen häufig die Angaben darüber, in welchem Stadtteil der Kunde wohnt. Da gibt es gute Wohnlagen und schlechte. Was aber, wenn plötzlich der Arzt oder der Rechtsanwalt, der in einem "schlechten" Stadtteil wohnt, Kunde werden will? Der Computer lehnt dies ab und wenn es dann keinen Mitarbeiter gibt, der versteht, dass das Modell wohl falsch war, dann erzeugen wir ein Problem. Diese Art von Technikhörigkeit wird unser größtes Problem sein: Wir vertrauen zu sehr auf das, was wir da schaffen. Es wird einige Zeit dauern und viele Fehleinschätzungen hervorbringen, bis man das hinbekommt. Der "Hauptmann von Köpenick" wird in fünf Jahren wieder ein sehr modernes Stück sein - man wird es dann allerdings auf die Datenwelt beziehen.
Klingt gefährlich: Viele Daten zu sammeln, mit großem Aufwand zu analysieren und dann die falschen Schlüsse daraus zu ziehen.
Finger Ja und nein. Entscheidungen beruhen bisher fast immer auf Erfahrungen aus der Vergangenheit. Und diese Entscheidungen waren schon immer Wahrscheinlichkeiten. Mit der Analyse von Big Data sollten die Fehler kleiner werden — aber wegen neuer Daten fangen wir auch an neue Arten von Fragen zu beantworten. Genau deshalb glaube ich, dass Big Data eine größere Veränderung in der Gesellschaft erzeugen wird als die Erfindung des Internets. Das Internet hat uns die Möglichkeit gegeben Dinge schneller zu tun. Big Data gibt uns die Möglichkeit, Dinge vorherzusagen. Das konnten wir vorher nicht.
Mehr über das Buch "Ask Measure Learn" von Lutz Finger lesen Sie in unserer Buchvorstellung: Wir hätten wissen können, wo Osama bin Laden war.
Das Interview führte Oliver Havlat.