Automatische Konvertierung von 4,4 Millionen Zeichnungen nach PDF/A-2

Projektbericht "Migration Bestandsdaten" im Bereich Netze der Deutschen Bahn AG

Die Ausgangslage:

Die Deutsche Bahn AG ist ein internationaler Anbieter von Mobilitäts- und Logistikdienstleistungen und agiert weltweit in über 130 Ländern. Über 310.000 Mitarbeiter sind im DB-Konzern beschäftigt, knapp 40% davon außerhalb Deutschlands. Im Personenverkehr befördert der DB-Konzern europaweit (inkl. Deutschland) in seinen Zügen und Bussen mehr als 12 Millionen Personen pro Tag. Im Bereich Transport und Logistik werden im europäischen Netzwerk pro Jahr rund 300 Millionen Tonnen Güter auf der Schiene und rund 100 Millionen Sendungen auf der Straße transportiert. In den weltweiten Netzwerken werden rund 1,3 Millionen Tonnen Luftfracht und rund 2,1 Millionen TEU Seefracht abgewickelt.

Durch eine regelmäßige, teil-automatisierte Aktualisierung der Dokumentation des Schienennetzes und der zugehörigen Bauwerke soll im Rahmen eines deutschlandweiten Projekts sichergestellt werden, dass der über Zeichnungen, Baupläne und Netzpläne digital dokumentierte Stand der Schienenanlagen den tatsächlichen Gegebenheiten entspricht, um z.B. bei Störungen schnell und mit sicheren Informationen eingreifen zu können.

Zu diesem Zweck sollen Mitarbeiter die entsprechenden Netzpläne und Zeichnungen des DB-Konzerns per Tablet abrufen können und direkt vor Ort mit dem tatsächlichen Stand vergleichen. Bei Abweichungen wird der Ist-Zustand festgehalten und eine Änderung des entsprechenden Plans mit entsprechendem Prüfungs- und Freigabezyklus angestoßen. Dazu wurde eine eigene App entwickelt, mit der die passenden Pläne für die ausgewählten Anlagen als PDF/A-2-Dateien auf ein Tablet geladen werden können.

Der DB-Konzern stand bei diesem Projekt vor der Herausforderung, dass der vorhandene Bestand von ca. 4,4 Millionen Zeichnungen zunächst in das Format PDF/A-2 konvertiert werden musste.

„Bei diesen Zeichnungen handelt es sich zum großen Teil um Scans und um archivierte CAD-Zeichnungen aus den unterschiedlichsten Quellen. Die Dateien stammen zum Großteil aus den letzten 20 Jahren, teilweise sind die Dateien aber auch viel älter. Zusätzlich zu den etwa 4 Mio. TIFF-Dateien umfasst der zu konvertierende Datenbestand auch einige Hunderttausend PDF-Dateien unterschiedlicher Herkunft sowie ca. 50.000 JPEG-Dateien“, berichtet Dr. Oliver Horvath Projektleitung BP 4.0 und operativer Projektleiter für das Konvertierungsprojekt bei der Deutschen Bahn.

Die Lösung:

Um den bestehenden Datenbestand möglichst schnell in das benötigte Dateiformat zu konvertieren, entschied sich das Unternehmen für eine Zusammenarbeit mit der Advanced Software GmbH aus Wiesbaden, die über langjähriges und tiefgehendes Know-how im Bereich der Konvertierung und Migration von großen Zeichnungsbeständen verfügt und die nötige Software deshalb sehr schnell liefern konnte.

Die Zeichnungen der Deutschen Bahn werden im Dokumenten-Verwaltungssystem (DVS) von SAP verwaltet. Entsprechend musste die Steuerung der Migrationssoftware auch mit SAP integriert sein. Die Ergebnisse der Konvertierungen werden wieder in SAP-DVS abgelegt. Advanced Software setzt dazu die Software „techdocpro – Technical Document Processor“ ein.

Diese Software enthält Monitoring-Tools, die eine ständige Überwachung der Migration über alle Server hinweg erlauben und bei Unregelmäßigkeiten entsprechende Eingriffe ermöglichen. Außerdem führt die Software auftragsbezogene und summarische Fehler-Journale, die automatisiert ausgewertet werden können, um bei der großen Zahl von Konvertierungen sowohl gezielt als auch für größere Mengen von Dateien insgesamt eingreifen zu können. Die eigentlichen Konvertierungen wurden parallel auf sechs Windows-Servern durchgeführt.

Im Rahmen der Konzeption des Projektes wurde festgelegt, dass die Steuerung der Migration ausschließlich in den Händen der Deutschen Bahn liegen sollte.

Die Mitarbeiter der Deutschen Bahn selektierten beispielsweise, welche Daten in welchen Migrationsläufen konvertiert werden sollten und konnten die Migration selbst anstoßen. Dadurch ergab sich eine optimale Überwachung und Feinsteuerung über den gesamten Migrationsprozess.

Um eine Parallelisierung zwischen Konvertierung und Nutzung der Daten zu erreichen, wurde die Migration nach Regionen durchgeführt. So konnten Mitarbeiter der Deutschen Bahn in bestimmten Gegenden bereits die Daten nutzen, während die Konvertierung für andere Regionen noch lief.

„Aufgrund der großen Menge an Daten und des engen Zeithorizonts, der für die Konvertierung angesetzt wurde, war uns von vornherein klar, dass eine sehr starke Parallelverarbeitung mehrerer Konvertierungen notwendig sein würde“, so Joachim Binder, Geschäftsführer der Advanced Software GmbH. Das stellte aber keine Schwierigkeit dar, da aus anderen Projekten bereits die Erfahrung für die Steuerung paralleler Konvertierungsprozesse mit der Verwaltung der Ergebnisse und dem Handling von fehlerhaften Dateien vorhanden war. „Wir konnten bereits bei den ersten Tests im Projekt genügend Instanzen mit der entsprechenden Warteschlangenverwaltung realisieren, um die notwendige Zahl von Konvertierungen zu erreichen“, so Joachim Binder.

Die Zeichnungen wurden über einen langen Zeitraum zusammengetragen, so dass Unterschiede in den Strukturen der Dateiformate zu erwarten waren. In früheren Jahren wurden sie an verschiedenen Standorten mit unterschiedlichen Einstellungen bezüglich Auflösung, Farbtiefe (24/8/1-Bit) etc. eingescannt. Neben DIN-Formaten gibt es spezifische Langformate der Bahn (z.B. A3 hoch, aber 3m lang). Teilweise waren zweiseitige TIFFs dabei, wobei die 2. Seite eine Miniaturdarstellung (Thumbnail) der ersten Seite ist.

In den letzten Jahren kamen andere Formate aus den verschiedenen CAD-Systemen hinzu, die nach PDF konvertiert wurden, aber auch Fotos im Format JPEG.

Daraus ergaben sich interessante Herausforderungen für die Konvertierung. Wirklich defekte Dateien  mussten von solchen mit speziellen Eigenheiten unterschieden werden, die das Konvertierungsergebnis nicht oder kaum veränderten. Auch bei der Umsetzung der PDF-Dateien in PDF/A-2 waren verschiedene Problem zu lösen, z.B. fehlerhaft eingebettete Fonts.

An diesem Punkt war die Erfahrung von Advanced Software aus vielen Konvertierungsprojekten sehr hilfreich. Bereits während der ersten Konvertierungsläufe konnten 97-98% der Zeichnungen erfolgreich konvertiert werden. Auf Basis der ersten Ergebnisse erfolgte eine Feinjustierung der Software-Lösung. Damit konnte die Fehlerquote auf etwa 0,75% reduziert werden. Ein zweiter Optimierungslauf reduzierte die Fehlerquote dann auf nur noch 0,28%. Auch an diesem geringen Prozentsatz wird noch weiter gearbeitet, da es sich in absoluten Zahlen immerhin noch um 11.500 fehlende Zeichnungen handelt. Außerdem konnten die wirklich fehlerhaften Dateien identifiziert und an den entsprechenden Bereich zur Erneuerung übergeben werden.

„Damit hat die Software-Lösung von Advanced Software unsere Erwartungen weit übertroffen“, resümiert Dr. Oliver Horvath. „Wir gehen fest davon aus, dass die Konvertierung zum geplanten Termin erfolgreich abgeschlossen werden kann“.

Ausblick:

Auch nachdem die Erst-Migration von 4,4 Millionen Zeichnungen beendet ist, wird die Software weiterhin in der laufenden Pflege der Zeichnungen eingesetzt. Dazu werden jeden Tag mehr als 1.000 Zeichnungen konvertiert.