Blog

Das *umBlog – Wissenswertes aus der Welt der Daten, Tech-Trends, Termine und Einblicke in unsere unglaubliche Company.

Unternehmen Zukunft 2.0: AWS, *um und die Reisendeninformation der Deutschen Bahn

Verfasst am 12.03.2019 von The unbelievable Machine Company

Case Study: AWS, *um und die Reisendeninformation der Deutschen Bahn

2015 hat die Deutsche Bahn (DB) ein einzigartig komplexes Projekt für die Reisendeninformation ins Leben gerufen. Gemeinsam mit AWS sind wir seither maßgeblich daran beteiligt, eine Plattform zu realisieren, die die Informationen konsistent auf alle angeschlossenen Kanäle verteilt. 

Projekt-Steckbrief

  • Projekt: Big-Data-Plattform für die Reisendeninformation der Deutschen Bahn
  • Laufzeit: seit Q4/2015, laufend
  • Methodik: Design Thinking, Agile, Scrum
  • Team: System Architects, Data Engineers, DevOps, Scrum Master
  • Framework: Amazon Web Services (AWS) Cloud

Das Problem

Du kommst am Bahnhof auf den Bahnsteig und stellst fest: Der Anzeiger sagt etwas anderes aus, als der DB Navigator gerade noch angezeigt hat; die Informationen stimmen nicht überein. Wer mit dem Zug fährt, hat das vermutlich schon so oder ähnlich erlebt – und sich gefragt, weshalb nicht überall die gleichen Informationen angezeigt werden. Die Antwort: Bislang waren die Daten nicht allen Informationskanälen gleichermaßen zugänglich.

2015 entschloss sich die Deutsche Bahn (DB) deshalb, eine einheitliche Plattform für die Reisendeninformationen zu entwickeln. Der Plan: Ein „Single Point of Truth" (SPOT), der die Informationen konsistent auf alle angeschlossenen Kanäle verteilt.

Dazu wurde ein Team aus internen DB-Mitarbeitern und externen Dienstleistern ins Leben gerufen, zu denen auch wir gehören: das Projekt „Reisendeninformations-Plattform" (RI), das sich dieses Themas annehmen und es agil vorantreiben soll.

Die Lösung

Technologisch im Zentrum: Eine Big-Data-Plattform, die auf Open-Source-Technologien und einer Microservice-Architektur basiert. Über die Microservices werden Daten aus den unterschiedlichen Quellen konsolidiert, ausgewertet und dann konsistent an Informationskanäle wie die Bahnsteig-Anzeigen an Bahnhöfen oder den DB Navigator ausgespielt.

Angesichts des enormen Datenvolumens, der notwendigen Kapazitäten für die nahezu Echtzeit-Datenverarbeitung und des benötigten Zugriffs von unterschiedlichen Standorten war von Anfang an klar, die Anwendung komplett in der Cloud zu entwickeln und zu betreiben. Sehr früh fiel bereits die Entscheidung, dies in Zusammenarbeit mit Amazon Web Services (AWS) zu tun, da Infrastruktur und Services den Anforderungen der Deutschen Bahn optimal entsprechen.

Die Herausforderung

Primäre Aufgabe war die Implementierung des SPOT, der die Informationen konsistent auf alle Informationskanäle und -Touchpoints verteilt.

Die Ausgangslage stellt unsere Datenspezialisten allerdings vor einige Herausforderungen. So mussten etwa die Daten aus zahlreichen unterschiedlichen Quellen mit teilweise sehr komplexen Schnittstellen akquiriert werden. Protokolle und Datenformate aus proprietären Lösungen waren teilweise veraltet, was die Konsolidierung zusätzlich erschwerte. Gleichzeitig musste auch eine technologische Konsistenz umgesetzt werden, etwa durch Automatisierungen im Update-Bereich.

Der *um Beitrag

2015

Am Projektbeginn 2015 stand ein Proof of Concept (PoC), der beweisen sollte, dass die Datenkonsolidierung mit Big-Data-Technologien abgebildet werden kann. Außerdem galt es zu zeigen, dass alle Rohdaten aus unterschiedlichen Quellen und Qualitäten zu einem vollständigen, konsistenten und aktuellen Datenstatus an einem einzigen Punkt in nahezu Echtzeit zusammengeführt werden können.

Dafür entwickelten wir zunächst die entsprechende Systemarchitektur und, darauf basierend, einen Fahrplan-Builder. Dieser erzeugt aus dem Kundenfahrplan und dem so genannten Betriebsfahrplan einen vollständigen Sollfahrplan. Auf diesen wiederum werden kurzfristige Fahrplanänderungen sowie Echtzeitdaten, wie zum Beispiel Zugpositionsmeldungen aus der Gleissensorik, gematcht. Damit konnten wir erstmals eine konsolidierte Sicht auf Daten erzeugen, die aus völlig unabhängig arbeitenden System stammen.

2016

Nach erbrachtem PoC galt es nun, das Projekt in die Tat umzusetzen. Die von uns entwickelte Datenplattform blieb die Basis für das Auslesen und die Analyse der Daten. Wir waren entspechend für das konzeptionelle und technische Design der Big-Data-Architektur sowie deren Implementierung zuständig. Dabei verfolgten wir den DevOps-Ansatz und nutzten das Skalierungs-Framework Nexus von Scrum, um zum Beispiel Abhängigkeiten aufzulösen und Integrationsprobleme zu vermeiden.

2017

In der Zusammenarbeit haben wir erste kundenwirksame Meilensteine erreicht. Darunter Gleiswechsel, die mittels der verarbeiteten Daten nun zuverlässiger und messbar früher erkannt werden.

2018

Im Mai letzten Jahres gab es den bisher größten übergreifenden Erfolg in der Projektumsetzung: die genauere Prognose/Vorhersage der Ankunfts- und Abfahrtszeiten im Fernverkehr. Schlüssel dazu war das Zusammenspiel von Big-Data-Analysen auf Grundlage der von uns entwickelten Plattform und den von unseren Projektkollegen integrierten Komponenten Machine Learning und Künstliche Intelligenz.

Der entscheidende Meilenstein wurde im August mit dem Produktivgang der RI-Plattform erreicht. In der sich anschließenden Pilotphase wurden dann bereits fast 50 Bahnhöfe bis Q1 2019 auf das neue System umgestellt.

Ausblick

Das Projekt ist längst noch nicht abgeschlossen. Realisiert wurde bis dato die Basis, die „richtig coolen" Features folgen in den nächsten Jahren.

Konkreter nächster Schritt für das laufende Jahr ist, die Pilotphase und damit den Roll-out der neuen Reisendeninformations-Plattform abzuschließen. Zunächst auf Bahnhöfe mit geringerer fachlicher Komplexität beschränkt, soll das neue System perspektivisch an jedem Bahnhof flächendeckend 24/7 in Deutschland in Betrieb sein, was vor allem eine Herausforderung für die benötigte Serverleistung darstellt. Es wird intensiv am deutschlandweiten Roll-out gearbeitet, damit die Reisenden überall konsistente und zuverlässige Informationen bekommen.

Verwendete Technologien
Für die Umsetzung der ereignisgesteuerten Architektur nutzt die DB neben der AWS Cloud folgende AWS- und Hadoop-Stack-Technologien:

  • EC2
  • RDS
  • ELB
  • Route53
  • S3
  • CloudWatch
  • CloudTrail
  • Apache Storm
  • Apache Spark
  • Apache Kafka
  • Apache Kafka Streams
  • Apache Cassandra
  • Apache Hazlecast

Partner
AWS Partner Network

Ansprechpartner
Philipp Schlüter 
p.schlueter@unbelievable-machine.com

Aktuelle Blogeinträge

Social Media

Kontakt

The unbelievable Machine
Company GmbH
Grolmanstr. 40
D-10623 Berlin

+49-30-889 26 56-0 +49-30-889 26 56-11 info@unbelievable-machine.com

Kostenloses Whitepaper

Data Thinking:
Erfolgsrezept für den digitalen Wandel

Zum Whitepaper