Ob ich mich dringend ärztlich untersuchen lassen sollte? Die Empfehlung wurde mir zumindest unlängst aus meinem privaten Freundeskreis zuteil, als ich erwähnte, in meinem Blog ein paar Worte über Big Data verlieren zu wollen. Sie werden sich erinnern: Verschiedene westliche Nachrichtendienste stehen seit Anfang dieses Monats im Blickpunkt der Berichterstattung über Projekte zur gezielten Auswertung von Daten, die weltweit über Internet ausgetauscht werden – so zumindest die Meldungen, die vermutlich nicht die letzten zum Thema bleiben werden. Ich kann an dieser Stelle nicht (und ich will auch gar nicht) die Aufgabe unserer Politiker übernehmen, demokratisch legitimiert die Gesellschaften zu formen, in denen wir leben wollen. Auch als Jurist tauge ich kaum.
Was mich persönlich fasziniert ist die Behauptung (sei sie wahr oder nicht), dass ein Nachrichtendienst eine derart riesige Menge an überwiegend unstrukturierten Daten und unsortierten Datenströmen gezielt auf bestimmte Hinweise hin zu untersuchen in der Lage sei. Denn letztlich könnten wir uns in IT und Softwareentwicklung durchaus als Nachrichtendienste für unsere Abnehmer sehen, seien es externe oder interne Kunden vom Sachbearbeiter bis zum Aufsichtsrat. Das hat viele Jahre lang bestens auf klassischen Wegen funktioniert. So wie auch der Tante-Emma-Laden um die Ecke über Jahrzehnte hinweg bestens funktionierte (Sie sind nicht alleine, wenn Sie ein wenig wehmütig daran zurückdenken). Heute aber sehen wir uns ganz anderen Herausforderungen einer sehr dynamischen Informationslandschaft gegenüber. Hersteller, Einzelhandelsketten, Logistiker, Banken, Versicherungen, Behörden und eine Menge weiterer Unternehmen und Organisationen verfügen über einen immer weiter zunehmenden Datenreichtum. Dass wir immer mehr mobile Geräte verwenden, die als Datenquellen fungieren, viele davon jederzeit im Netz, beschleunigt die Entwicklung rasant; die Menge an Datenquellen nimmt beständig weiter zu, die Datenmenge wächst exponentiell.
Fallbeispiel Netflix
Ich sehe in dieser Datenvielfalt eine großartige Chance. Schließlich kann sie, richtig eingesetzt, in allen möglichen Situationen einen Mehrwert bieten, den ich auch als Individuum etwa im Berufsleben gewinnbringend nutzen oder privat als Komfort genießen kann. Nehmen wir als Beispiel den vorwiegend online tätigen Videoanbieter Netflix, der bislang vor allem in den USA anbietet und in Europa Großbritannien und Irland versorgt:
Er unterbreitet Nutzern Vorschläge für weitere Formate, die ihren bisherigen Präferenzen entsprechen. Dafür nutzt er sehr zeitnah eine Vielzahl an Informationen, um das Interessenprofil des Kunden automatisiert einschätzen zu können, von der Art der bisher gesehenen Filme und Serien über den Zeitpunkt bis hin zu den Pausen und Wiederaufnahmen meines Medienkonsums. Eines der wichtigeren Vorauswahlkriterien des Dienstes ist es aber, im Rahmen der Auswertung sämtlicher Kundendaten neue Trends aufzuspüren, durchaus auch unterschiedlich für die verschiedenen Zielgruppen, und durch aktives Angebot zu verstärken. Das geht so weit, dass Serien, die inzwischen auch als Auftraggeber produziert werden, für verschiedene Zielgruppen mit unterschiedlichen, passgenauen Trailern beworben werden. Mit Ausnahme der Serienproduktionen vielleicht konnte Tante Emma das auch, als sie damals ihre Videothek hatte, werden Sie sagen. Und Sie haben vollkommen Recht. Ihr Problem war aber, dass ihr Modell nicht skalierte; mit den 36 Millionen Kunden von Netflix und deren 4 Milliarden Stunden Medienerfahrung sähe Emma alt aus, vom daraus resultierenden monatlichen Pauschalpreis von 7,99 US-Dollar (oder 5,99 britischen Pfund) bei bester Geschäftsentwicklung gar nicht zu reden.
Raus aus der Serienbrief-Falle
Sie kennen weitere Beispiele, etwa aus Online-Handel, Auktionsplattformen und Nachrichtenwelt. Die Auswertung einer möglichst breiten Datenbasis ist im Online-Business längst ein geschäftskritischer Erfolgsfaktor. Die Offline-Welt darf dem in nichts nachstehen, sie muss weg von verstaubten Kundenansprachen. Ich will in meinem Briefkasten keine Serienbriefe mehr finden mit Personalisierungen, die sich schon im Eindrucken meines Namens (gerneauch mit „ä“) auf ein Massenanschreiben erschöpfen und damit neben Streuverlusten für ihr Unternehmen bei mir als Umworbenem das negative Image der Werbeansprache vergangener Jahrzehnte zementieren.
Unternehmen müssen sich lösen vom selbstzentrischen Bild des Anbieters, den der Kunde findet, und dem kundenzentrischen Selbstbild des Problemlösers annähern, der den Kunden und seinen Bedarf findet. Das geht hinaus über Kundenkommunikation bis hinein in Fragen wie die, in welchen Filialen eines bundesweiten Anbieters in den kommenden 2 Wochen mehr Vorrat an Sonnencreme gebraucht wird als in anderen. Und dabei kommt es bei Weitem nicht nur auf das Wetter an, sondern auch auf Topographie, Naherholungsgebiete, Feiertage und Ferienzeiten, aktuelle Werturteile von Testzeitschriften, Trends in Social Media und diversen weiteren Einflussgrößen, deren Auswertung an die Stelle von Tante Emmas Bauchentscheidungen treten. Das betrifft die Frage, mit welchem Angebot ein Anbieter an welchem Ort reüssieren kann, beispielsweise auch als reisender Politiker in Wahlkampfzeiten. Und das inkludiert Forschungsprojekte aller Art, die für komplexeste Fragestellungen auf Datenwüsten jeglicher Art Rückgriff nehmen können und uns so als Gesellschaft nach vorne bringen.
Wie aber wertet man eine große Vielzahl an diversen Datendarstellungen möglichst schnell aus, um auch als Unternehmen innerhalb kürzester Zeit Entscheidungen auf möglichst breiter Datenbasis treffen zu können? Schon das Laden solcher Datenberge stellt klassische Lösungen vor ein komplexes Problem, an dessen Ende oft genug entweder unvollständige Daten oder verzögerte Auswertungen stehen. Auf diese Problemstellungen gibt Big Data die Antwort. Für mich deswegen ganz klar ein Thema, mit dem unser Stand in Management-Etagen punkten kann und muss. Nicht nur Kundenbeziehungen fußen heute auf massiven Datenbergen. Auch Logistikplanung, Trendforschung, Risikoabschätzung, Strategiefindung, ja die Wettervorhersage gar wird umso brauchbarer, je mehr Detaildaten ein Auswertungsmodell unterstützen können.
Durch neue Datenanalyse und -auswertungsmodelle gelingt es, solche Berge von Daten, strukturiert und unstrukturiert, zu verarbeiten und dank prädikativer Konzepte des „Maschinellen Lernens“ Abläufe und Wahrscheinlichkeiten axiomatisch vorauszusagen. Für das Stillen des erheblichen Speicher- und Prozessorhungers steht heute anstelle eigener Rechenzentren optional die Cloud zur Verfügung – eine Ressourcendemokratisierung, die nicht nur in erheblicher Weise Kosten reduziert, sondern den Big Data-Markt und sein Potenzial vielen Interessierten auf Dienstleister- und Anwenderseite überhaupt erst eröffnet. Jenseits der klassischen Datenbank- und BI-Werkzeuge steht damit eine vergleichsweise neue, spannende Generation von Lösungen bereit, die durch schnellen und zielsicheren Überblick datengestützte Unternehmensentscheidungen ermöglichen. Und dies endlich ökonomisch sinnvoll auch für mittelständische Unternehmen.
Bestens aufgestellt mit Hadoop
Nehmen Sie beispielsweise unseren Dienst Windows Azure HDInsight: Damit bauen Sie einfach in der Cloud Apache Hadoop-Cluster auf – Hadoop in der Cloud. Hadoop, sollten Sie es noch nicht kennen, ist ein bewährtes und durchgesetztes Open Source-Lösungsframework für die Beherrschung von Big Data-Szenarien mit einfachen Programmiermodellen. Und wir haben es mithilfe des langjährig erfahrenen Partners Hortonworks nicht nur für unsere Cloud implementiert, sondern für Anhänger der privaten Infrastruktur auch für Windows Server, dessenBusiness Intelligence-Portfolio im Zusammenspiel mit SQL Server, SharePoint Server und Microsoft Office Sie längst aus der 1. Liga kennen. Ob Sie Ihre Daten also bereits kostengünstig und sicher in der Cloud speichern und analysieren möchten, noch Ihre eigenen IT-Ressourcen bevorzugen (müssen), oder sich auf dem Weg vom klassischen ins moderne Umfeld befinden und dabei einen iterativen hybriden Weg beschreiten: Mit Microsoft sind Sie mit allen Optionen moderner Datenveredelung auf der sicheren Seite.
Keynotes der Woche im Live-Stream
Auf meine persönlichen Daten greife ich in dieser Woche übrigens von San Francisco aus zu; von unserer Entwicklerkonferenz //build/ aus, deren Keynote wir am Mittwoch, 26.6. ab 17.30 Uhr mit einem kleinen Rahmenprogramm live im Netz übertragen. Auch falls wir Sie nicht vor Ort antreffen dürfen, müssen Sie die Build-Keynote nicht alleine am Schreibtisch genießen: Vernetzen Sie sich doch einfach mit uns zum kostenlosen Public Viewing in Berlin, Köln oder München – inklusive Konferenzschaltung und Live-Ausflug zu unserer DPE-Kollegin in Madrid. Die nämlich darf bei beneidenswert besserem Wetter von der TechEd Europe 2013 berichten, der europäischen Schwesterkonferenz unserer TechEd USA am Anfang dieses Monats. Klinken Sie sich dort auch am Dienstag, 25. Juni ab 9.00 Uhr ein in die TechEd-Eröffnungskeynote „The Cloud OS: It’s Time!“ von Brad Anderson, oder lauschen Sie am Donnerstag, dem 27. Juni ab 8.30 Uhr den Worten von Jon DeVaan, mit dem wir die Meinung teilen: „Windows is the Future“. Stay tuned!
Herzliche Grüße
Ihr Peter Jaeger
Die Keynote-Termine der Woche:
Di., 25.06.2013, 09.00 Uhr: TechEd-Eröffnungskeynote „The Cloud OS: It’s Time!“
Mi., 26.06.2013, 17.30 Uhr: Build-Keynote & Public Viewing
Do., 27.06.2013, 08.30 Uhr: TechEd Day 2 Keynote: „Windows ist the Future“