thumb

Die Arbeitsmarktstatistik des Bundes, die dem Staatssekretariat für Wirtschaft (Seco) angegliedert ist, betreibt bereits seit 2003 ein Business-Intelligence-System auf Basis eines klassischen Data Warehouse. Schon mit dieser ersten BI-Generation konnte man die früher üblichen, mit allmonatlich 17.000 Seiten sehr umfangreichen und entsprechend unpraktischen Statistiken in Papierform durch eine viel bequemere Browserabfrage ablösen. Nun wird das bestehende System durch eine EMC Greenplum Database abgelöst.

Im Rahmen der anstehenden Erneuerung der Infrastruktur für das BI-Umfeld wurde die bestehende Architektur und Umgebung laut Mitteilung durch das Seco und den langjährigen Beratungspartner Saracus Consulting kritisch hinterfragt. Dabei wurden verschiedene Alternativen geprüft und der Entscheid fiel schliesslich auf eine Massiv Parallel Processing Datenbank von EMC Greenplum.

EMC Greenplum habe bei Seco mit ihrer Proof-of-Concept-Installation, in der die EMC Greenplum Database das bisherige Datenbanksystem ersetzt, eine neue Datenbanklösung geschaffen, die den Anforderungen von „Big Data“ genüge, wird in der Aussendung betont. Die Greenplum-Datenbank arbeitet mit massiv-paralleler Verarbeitung (MPP). Ein Master-Server steuert die Verarbeitung auf beliebig vielen Segment-Servern – die Lösung ist flexibel skalierbar und lässt sich auf unterschiedlichen Hardwareplattformen betreiben. Der Proof of Concept der Arbeitsmarktstatistik umfasst den Angaben gemäss einen Master-Server, ergänzt durch einen zweiten Server für Redundanz, sowie vier Segment-Server.

Das Seco startete bereits im Jahr 2007 mit dem sogenannten Projekt Lamda X (Labor Market Data Analysis). Die BI-Lösung wurde auf einem neuen Quellsystem aufgesetzt und das Frontend neu auf Basis von Microstrategy 9 entwickelt. Damit seien flexiblere Auswertungen und künftig auch Abfragen von Mobilgeräten möglich geworden, wird verlautet. Im Rahmen von Lamda X wurden bis 2009 verschiedene BI-Anwendungen mit teils komplexen Berechnungen realisiert, darunter etwa die offizielle Arbeitsmarktstatistik, Auszahlungsstatistiken der Arbeitslosenversicherungen, Führungskennzahlen (KPI) für die RAV-Leiter sowie Arbeitsloseninformationen für die Öffentlichkeit, die unter www.amstat.ch abgerufen werden können.

Für Dr. Elmar Benelli, Leiter Data Warehouse Lamda beim Seco, sei die Flexibilität bei der Hardware matchentscheidend gewesen, heisst es. Secos Data Warehouse ist mit rund 500 GB, davon 200 für die Data Marts, relativ klein und benötigt daher vor allem auch Skalierbarkeit nach unten. EMC Greenplum erlaube ebenfalls den Betrieb auf preisgünstigen Industriestandard-Servern, die Seco bei den üblichen Bundeslieferanten unkompliziert beschaffen könne.

„Das Team aus Mitarbeitern des Seco, der Saracus, des Bundesamts für Informatik und Telekommunikation (BIT) als Lösungsbetreiber sowie von Microstrategy und von EMC hat sehr gut zusammengearbeitet. Die Techniker haben sich schnell gefunden, waren immer gut erreichbar und haben Probleme jeweils zuverlässig gelöst.“ Laut Elmar Benelli konnte die Testphase Anfang Sommer 2012 erfolgreich abgeschlossen werden. Nun werde das bestehende System und die neue EMC-Greenplum-Lösung einige Monate parallel betrieben und dabei letzte Bereinigungen und Optimierungen eingebaut. Spätestens Ende Jahr soll die Schweizerische Arbeitsmarktstatistik dann definitiv über die neue Datenbank laufen.

Zu den rund 900 Nutzern gehören neben den zuständigen Bundesstellen Mitarbeitende der 120 regionalen Arbeitsvermittlungszentren (RAV) in den 26 Kantonen sowie der über 40 Arbeitslosenkassen.