Data Scientist: Datengestützt die Zukunft analysieren
Das Berufsbild des Data Scientisten
Mit dem Begriff Data Scientist ist eine neue Berufsbezeichnung aufgetaucht. Nur ein Modewort oder was steckt dahinter? Die Digitalisierung führt dazu, dass immer mehr Daten generiert werden und die Realität sehr gut abbilden. Es wird möglich, Muster zu erkennen und somit zuverlässige Aussagen über mit hoher Wahrscheinlichkeit eintretende Zustände zu treffen. Data Scientisten erstellen datengestützt Prognosen und ersetzen somit einfache Annahmen durch methodische Verfahren. Um aus der unstrukturierten Datenflut Informationen hinsichtlich künftiger Entwicklungen abzuleiten, bedarf es eines Experten, der die Daten mit modernster Business Intelligence Software systematisch auswertet. Mit dieser anspruchsvollen, komplexen Aufgabe beschäftigt sich der Data Scientist.
Big Data und IoT
Im Zeitalter von Big Data und IoT (Internet of Things) hängt der Erfolg von Unternehmen maßgeblich davon ab, ob es gelingt, die Datenflut zu kanalisieren und zu nutzen. Die Firmen benötigen dringend bestens qualifizierte Experten, die unterschiedliche Datenquellen zusammenfügen und mit Hilfe explorativer Software die Daten in handlungsrelevante Informationen transferieren. Wer im Bereich der Datenauswertung der Konkurrenz überlegen ist, wird aufgrund des daraus resultierenden Wissens entscheidende Wettbewerbsvorteile realisieren. Aus diesem Grund suchen viele Unternehmen verzweifelt derartige IT-Experten, sodass dieser Beruf z. Zt. auch als „The Sexiest Job of the 21st Century“ bezeichnet wird.
The Sexiest Job of the 21st Century
Datenwissenschaftler – so könnte man die englische werden nicht nur in der Wirtschaft, sondern auch in anderen Bereichen beschäftigt, denn die Digitalisierung führt dazu, dass überall Daten gesammelt werden, aus denen sich Informationen extrahieren lassen. Im Gesundheitswesen ermöglicht die Einbeziehung einer breiten Datenbasis verbesserte Diagnosen und Therapien, indem beispielsweise Körperfunktionen überwacht und Unregelmäßigkeiten sehr früh festgestellt werden. In der Krebsdiagnostik sind durch die Auswertung großer Datenmengen und die datengestützte Verbesserung bildgebender Verfahren schnellere und präzisere Diagnosen möglich, sodass die Heilungschancen steigen. Ein weiterer Anwendungsbereich ist die Stadtplanung. Hier bietet die Auswertung von Massendaten (beispielsweise Verkehrsdaten) ebenfalls neue Chancen. Datenwissenschaftler werden überall eingesetzt, wo aus unstrukturierten Massendaten Informationen gewonnen werden, sodass ständig neue Einsatzbereiche hinzukommen.
Die Herausforderungen der Digitalen Transformation
Eine zunehmende Digitalisierung der Wirtschaft und Gesellschaft führt dazu, dass täglich riesige Datenmengen generiert werden. Die Zahl der digitalen Devices, die Daten produzieren, steigt ständig. Das beginnt bei smarten Kühlschränken, reicht über Connected Cars und erreicht einen vorläufigen Höhepunkt bei der vollkommen digitalisierten Fabrik, die auch vor- und nachgelagerte Geschäftsprozesse integriert. Jedes Jahr kommen unvorstellbare 33 Zettabyte an neuen Daten hinzu. Zur Veranschaulichung: Ein Zettabyte besteht aus Sextillionen (1.000.000.000.000.000.000.000) Bytes bzw. einer Milliarde Terabytes. Es gibt nur eine höhere Einheit, die Yottabytes. Wahrscheinlich werden in Zukunft weitere Einheitsbezeichnungen hinzukommen, denn die Datenmenge steigt exponentiell. Gelingt es der Wissenschaft, einen Durchbruch im Bereich der Quantencomputer zu erzielen, werden die Datenmengen nochmals in völlig neue Dimensionen vorstoßen.
Leider fallen die Daten jedoch unstrukturiert an und bieten somit keine Möglichkeit, daraus direkt Informationen zu generieren. Hier kommt der IT-Experte ins Spiel, denn der Datenwissenschaftler übernimmt die komplexe Aufgabe, aus den unstrukturierten Rohdaten eine Datenbasis zu bilden, die strukturiert ist und die Informationsgewinnung ermöglicht. Diese Informationen dienen dem Management als Entscheidungsgrundlage. Gelingt es, möglichst viele Informationen zu extrahieren, wird es möglich, Entscheidungen wissensbasiert zu treffen, anstatt sich nur auf Annahmen zu stützen. Auf diese Weise wird die Entscheidungsqualität erhöht. Im globalisierten Wettbewerb werden sich die Unternehmen durchsetzen, denen der Prozess der professionellen Daten Analyse am besten gelingt. Insofern sind die Qualifikationen, über die ein Data Scientist verfügt, sehr stark nachgefragt. Besonders im Mittelstand besteht noch ein Defizit an professioneller Datenanalyse. Firmen, die das erkennen und entsprechend handeln, realisieren große Wettbewerbsvorteile.
Turning Data into Information“: Warum Datenwissenschaftler immer wichtiger werden!
Generell handelt es sich bei einem Datenwissenschaftler um einen Experten für die Daten Analyse. Daraus resultiert die Anforderung, sich in den Bereichen Datenverarbeitung sowie Statistik bestens auszukennen. Der Mangel an qualifizierten Datenwissenschaftlern ist ein wesentlicher Grund dafür, dass viele Firmen den Wert ihrer Datenbestände nicht annähernd nutzen und dadurch Erfolgspotenziale verschenken.
Potenzial analysieren
Die Experten müssen vorliegende Fragen datenbasiert beantworten oder die Datenbestände im Hinblick auf das Potenzial analysieren, neue Fragen zu beantworten. In den multinationalen Konzernen wurden spezielle Teams mit hochspezialisierten IT-Experten aufgebaut, die über Fähigkeiten in den Feldern Technologie, Analyse-Tools, Programmiersprachen und Methodenkompetenz im Bereich Statistik verfügen. Für kleinere und mittelständische Unternehmen ist es hingegen wichtig, dass der Datenwissenschaftler über die Skills eines Daten-Allrounders verfügt und das gesamte Aufgabenspektrum übernimmt. Da noch nicht genügend Experten auf dem Arbeitsmarkt verfügbar sind, bemühen sich viele Firmen, ihre IT-Mitarbeiter zu qualifizieren oder nutzen externe Berater, die diese Aufgaben übernehmen.
Chancen für den Mittelstand
Die Daten zeichnen sich mehr und mehr dadurch aus, dass die Realität immer genauer abgebildet wird. Es steckt ein großes Potenzial in den Datenbanken, das auch mittelständische Unternehmen keinesfalls vernachlässigen sollten. Ein Beispiel ist der Aufbau besserer Kundenbeziehungen, weil man mit Hilfe der Daten die einzelnen Kunden besser kennenlernt und demzufolge gezielt individuell ansprechen kann. Damit sind die Zeiten ungezielter und somit wenig erfolgreicher E-Mail-Kampagnen und der Streuverluste von teuren Werbemaßnahmen vorbei. Ein anderes Beispiel ist der Produktionsbereich. Hier hilft die Daten Analyse dabei, anhand von Maschinendaten einen optimalen Wartungszeitpunkt festzulegen und ungeplante Maschinenausfälle zu vermeiden.
Zunächst muss der Experte für eine solide Datenbasis sorgen, damit qualitativ hochwertige Aussagen möglich sind und die gemachten Voraussagen mit hoher Wahrscheinlichkeit eintreffen. Zu diesem Zweck wird die Frage beantwortet, welche Daten für eine bestimmte Entscheidung relevant sind und woher man diese Daten bekommt. Für das Marketing ist beispielsweise interessant, welche Eingaben die Besucher der Website im Suchfeld machen. Daraus lassen sich wichtige Informationen zum Nutzerverhalten gewinnen. Es wird deutlich, an welchen Produkten die User am meisten interessiert sind und welche besonders oft wieder zurückgeschickt werden und dadurch Kosten verursachen. Auch die Rücksendegründe lassen sich eruieren. Es ist ein Unterschied, ob Kunden oft Waren zurücksendet, weil diese defekt sind oder weil die Produkte nicht den Vorstellungen entsprechen. Im ersten Fall muss im Produktionsbereich nach den Ursachen gesucht werden, wohingegen im zweiten Fall das Angebot generell überdacht werden sollte.
Welche Aufgaben übernimmt der Data-Scientist?
Die unstrukturierten Rohdaten werden im nächsten Schritt für den definierten Usercase aufbereitet. Jetzt werden die als relevant erachteten Datensätze extrahiert, um Daten herauszufiltern, die keinen Erkenntnisgewinn bringen. Danach erfolgt das Mappen der Daten und die Konvertierung des bereinigten Datensatzes in ein geeignetes Format. Um Muster zuverlässig zu erkennen, betrachtet man die Daten der vergangenen drei Jahre. Werden engere Zeitfenster gewählt, ist die Gefahr zu groß, dass sehr starke Abweichungen auftreten, die nicht der realen Entwicklung entsprechen. Auf Basis der gewonnenen Datengrundlage werden mathematische Modelle erstellt und anschließend mit Tests und Trainings überprüft. Die auf dieser soliden Datenbasis getroffenen Voraussagen werden mit hoher Wahrscheinlichkeit eintreffen.
Das Aufgabenfeld setzt sich aus drei Bereichen zusammen:
- Identifikation und Analyse von strukturierten und unstrukturierten Datenquellen, inklusive dem Tracking und Monitoring von Daten
- Entwicklung von Methoden der Daten Analyse, hier ergeben sich Überschneidungen zum Aufgabenfeld eines KI-Entwicklers
- Auf Basis der Analyse werden Muster der Vergangenheit (Pattern Recognition) erkannt und Prognosen erstellt
In vielen Fällen schließt sich an die Prognose die Generierung von Handlungsempfehlungen an. Dafür benötigt der Datenwissenschaftler ein tiefgreifendes Verständnis der betriebswirtschaftlichen Zusammenhänge innerhalb des Unternehmens. Ein erfolgreicher Datenwissenschaftler sollte für die Ausübung dieses anspruchsvollen Berufs über Skills in folgenden Bereichen verfügen:
- lineare Algebra
- Programmierung
- Statistik
- Systemarchitektur
- Business Intelligence Applikationen
- Datenstrukturen
- Kommunikationstalent
- breites betriebswirtschaftliches Fachwissen
- Koordinationsfähigkeit
- Kreativität
Welches sind die Einsatzgebiete Data-Scientist?
In jedem Unternehmen werden IT-Experten benötigt, die für eine optimierte Datenanalyse sorgen. Insofern reichen die Einsatzgebiete von kleinen Startups über den Mittelstand bis zu multinationalen Konzernen. Während der Experte in kleinen Unternehmen und im Mittelstand das Aufgabengebiet ganzheitlich betreut, sind in Großkonzernen Spezialisten für einzelne Teilbereiche gefragt. Manchmal tritt dabei die Datenanalyse in den Hintergrund und wird von hochentwickelter Business Intelligence Software durchgeführt. Der Datenwissenschaftler übernimmt die visuelle Datenaufbereitung, die unverzichtbar ist, damit die Entscheidungsträger den Informationsgehalt adäquat erfassen können.
Datenwissenschaftler werden dort gebraucht, wo große Datenmengen anfallen und Unternehmen aus diesen Daten Schlüsse für die Zukunft ziehen möchten. Die Optimierung von Geschäftsprozessen und die individuelle Ansprache von Kunden und Interessenten steht dabei meist im Vordergrund. Es werden Ziele angestrebt wie die Reduzierung von Retouren, die Vermeidung ungeplanter Maschinenausfälle, die Optimierung von Fahrplänen im Logistikbereich oder die Gestaltung eines effizienten Onlinemarketings.
In der Energiebranche ermöglicht die Auswertung der Daten, Stromspitzen zu antizipieren und entsprechende Vorkehrungen zu treffen und in der Versicherungsbranche wird mit der Datenauswertung erreicht, Risikoprofile zu erstellen. Besonders wichtig ist die Arbeit eines Datenwissenschaftlers für den gesamten Bereich des Online-Business. Onlineshops nutzen Algorithmen, um ein besseres Ranking auf den Trefferlisten der Suchmaschinen zu erreichen. Außerdem ist es möglich, Nachfragespitzen zu antizipieren und dann in Echtzeit mit Preisanpassungen zu reagieren. Flug- und Hotelbuch-Portale maximieren auf diese Weise ihre Gewinne.
Im Bereich des Onlinemarketings werden die Datenanalysen genutzt, um die Kunden zum richtigen Zeitpunkt mit dem richtigen Angebot anzusprechen und die Werbung maximal zu personalisieren. Sehr interessante Einsatzfelder bietet die Medizin. Ein Abgleich mit ähnlichen Fällen beschleunigt die Diagnose und ermöglicht eine schnelle Entscheidung für eine Medikation sowie Therapie. Sehr herausfordernd ist die Analyse von Audiodaten, denn dabei handelt es sich um extrem unstrukturierte Daten. Doch die Möglichkeiten, die sich durch die gezielte Auswertung dieser Audiodaten ergeben, sind derart faszinierend, dass Unternehmen große Anstrengungen in Kauf nehmen. Man benötigt keine komplizierte Datenauswertung und kann auch ohne Data Analytics feststellen: Die Zukunft der Datenwissenschaftler ist gesichert und bietet hervorragende Perspektiven.