Das Mitarbeitermagazin von team neusta

Innovation-Centre im Pott

Lasst uns zur Abwechslung mal gen Westen auf die Hochburg der klassischen Industrie schauen. In den vergangenen zwei Jahren ist in Essen ein hochspannendes Innovationszentrum entstanden: Das team neusta-Data Science Lab. Wir finden, es ist höchste Zeit, dass wir diesen Ort einmal genauer betrachten:
Als Dependance von neusta software development west ist das Data Science Lab ganz stilecht in einem historischen Zechenverwaltungsgebäude angesiedelt. Wo früher Stahl gegossen wurde, verarbeiten heute Data Scientists Datenmengen zu zukunftweisenden Lösungen. Past meets future sozusagen. Aber was genau steckt nun eigentlich hinter dem Begriff Data Science?

Eine hoch-interdisziplinäre Angelegenheit
Data Science ist die Schnittmenge der drei Fachrichtungen Mathematik, Informatik und Empirische Wissenschaften. Die Anwendungsmöglichkeiten von Data Science sind vielfältig. Im Kern geht es allerdings immer um Informationsgewinnung aus großen, oft unübersichtlichen Datenmengen. Unter Einsatz selbstlernender Algorithmen werden die Erkenntnisse nutzenbringend zur Überwindung von Problemen und Vereinfachung des Alltags verwertet. Ob Sprach- und Bilderkennung, autonomes Fahren oder persönliche Netflix-Empfehlungen – im Hintergrund arbeiten immer Methoden aus dem Data Science-Werkzeugkasten.

Im team neusta-Data Science Lab arbeiten sechs Kollegen im interdisziplinären Team mit ganz unterschiedlichen Schwerpunkten: Mathematik, Chemie, Physik, Ökonometrie und Virtual Reality – all diese Bereiche werden von den Experten innerhalb des Data Science Labs abgedeckt. Und die Einsatzbereiche könnten vielfältiger nicht sein: Aktuell sind datengetriebene Projekte für die Wasser- und Abwasserwirtschaft, die Pharma- und Klebstoffindustrie, für Reifenhersteller und für das Versicherungswesen in der Pipeline.

Unterschiedliche Methoden und Verfahren
Durch unsere breite Kenntnis mathematischer Methoden können wir für unsere Kunden die besten Verfahren zur Lösung ihrer spezifischen Fragestellungen zusammenstellen:
 
Maschinelles Lernen
Computer lernen aus vorhandenen Daten, eine konkrete Aufgabe immer besser zu lösen. Dabei kann es sich jeweils auch um komplett neue Datensätze handeln. Diese Aufgabe kann zum Beispiel eine Klassifikation sein: „Beschwert sich ein Kunde in einer E-Mail über eine Flugverspätung? Ja oder Nein?" Oder aber eine Vorhersage: „Wie viele Kugeln Vanilleeis kann ich nächsten Monat an diesem Standort verkaufen?" Wir setzen maschinelle Lern-Algorithmen in fast allen unseren Projekten ein – wie beschrieben zur Text-Klassifikation, zur Vorhersage von Bedarfen oder auch zur Bewertung der Zustände von technischen Anlagen. 

Zeitreihenanalyse
Zeitreihendaten sind die am häufigsten in unseren Projekten verwendeten Daten: ob Sensoren in einer Maschine oder im Smartphone, Ereignisse wie Benutzer-Interaktionen auf Webseiten (etwa Verkäufe von Artikeln) oder auch Windenergie-Strompreise – bei all diesen Daten spielt der Zeitpunkt der Messung beziehungsweise der zeitliche Ablauf eine wichtige Rolle. Wir greifen in den meisten Projekten auf Zeitreihenanalysen zurück, um für Kunden Vorhersagen zu treffen. Wir verwenden sowohl klassische statistische Zeitreihenanalysemethoden als auch Verfahren aus dem Bereich des maschinellen Lernens.

Topologische Datenanalyse
Neben maschinellem Lernen haben sich in den vergangenen Jahren immer wieder Algorithmen und weitere effektive Verfahren zur Analyse großer Datenmengen etabliert. Eines dieser Verfahren ist die topologische Datenanalyse, die qualitative Form- und Struktureigenschaften von Daten erfasst und nutzbar macht. Unser Team setzt Methoden der topologischen Datenanalyse beispielsweise bei der Verortung von Fehlerzuständen in technischen Anlagen der Wasserwirtschaft ein. 

Text- und Sprachanalyse
Unstrukturierte Textdaten machen ebenfalls einen großen Teil der heute verfügbaren Daten aus. Aufgaben wie die automatische Beantwortung von Kundenanfragen oder aber die automatisierte Steuerung an den richtigen Sachbearbeiter sind beispielsweise in der Touristik essenziell. Wir setzen hier neben klassischen Verfahren neuronale Netze ein, um zum Beispiel herauszufinden, ob ein Kunde sich über Baustellenlärm beschwert oder das Hotel-Essen beanstandet. 

Predictive Alerting
Bei technischen Anlagen, beispielsweise in der Wasserwirtschaft, geht es häufig darum, Störsituationen und Defekte frühzeitig zu erkennen. Predictive Alerting bedeutet für den verantwortlichen Mitarbeiter: Eine automatisierte Lösung nimmt ihm die Detail-Überwachung ab, indem sie rechtzeitg auf Störsituationen hinweist. Hier kommen verschiedene Verfahren aus der Anomaliedetektion und dem maschinellen Lernen zum Einsatz.