Ein Meer voller Daten (Symbolbild: Shutterstock)

Der Ansatz von Datameer geht von den komplexen und fragmentierten Datenarchitekturen in fast allen grösseren Unternehmen aus. Diese besitzen Datenlandschaften, die mit den Jahren immer komplexer und unübersichtlicher geworden sind – besonders mit jeder neuen Einführung einer Datenmanagement-Technologie.

Folgt man diesem Annsatz, standen am Anfang traditionelle on-premise Data Warehouses, die dann durch Hadoop Data Lakes in den Rechenzentren und durch Data Warehouses in der Cloud ergänzt wurden, gefolgt von hybriden und Multi-Cloud-Umgebungen. Die Datentypen entwickelten sich immer weiter auseinander, und immer neue Modelle entstanden. Die klassischen Data-Warehouse-Technologien von IBM oder Teradata erhielten immer mehr Konkurrenz durch neue Anbieter wie Snowflake, Tableau oder Talend.

Diese Entwicklung führte zu immer mehr Problemen:
- IDC geht davon aus, dass die Anwender solcher Technologien heute durchschnittlich 73 Prozent ihrer Zeit mit der Suche und Aufbereitung von Daten verbringen.
- Und 60 Prozent der Verantwortlichen in den Unternehmen haben laut Forrester wegen solcher Probleme ihr Vertrauen in die Analyse von Daten verloren.
- Mehr als 60 Prozent der in den Unternehmen vorhandenen Daten werden nicht mehr für Analysen benūtzt, heisst es ausserdem bei Forrester.
- 20 Prozent der Zeit werden damit verschwendet, Analysen im Prinzip neu zu machen oder solche zu wiederholen, die schon einmal durchgefūhrt worden waren (IDC-Untersuchungen).

Die Datameer Cloud Platform will gegen solche Tendenzen gegensteuern. Mit Datameer Spectrum werden Daten transformiert und in das Cloud Data Warehouse verlagert, während dann mit Datameer Spotlight Queries und Analysen durchgeführt werden. Mit derzeit etwa 200 Connectoren können Daten aus On-premise- und aus Cloud-Quellen und -Libraries integriert werden.

Die Analysten von Gigaom schreiben in einem Bericht vom Januar 2021 ("Sponsored by Datameer"), dass eine neue Third-Party Platform geeignet sei, Daten in eine Cloud-Umgebung zu transferieren und dort effektiv und kostengūnstig aufzubereiten und zu analysieren. Datameer Spectrum und Spotlight helfen auf diesem Weg, schreiben die Analysten Andrew J. Brust und Yiannis Antoniou.

Datameer Spotlight ist laut Gigaom eine virtuelle Data Management Platform, die eine verteilte Query Engine, Self-Service Tools und einen Data Catalog verwendet, mit dem Teams von Analysten einen leichten Zugang zu den Daten des Unternehmens finden, unabhängig von Typ oder Speicherort der Daten. Neben diesem ersten Schritt des Datenzugangs lassen sich Modelle für mögliche Dateninterpretationen entwickeln. Spotlight sorgt gleichzeitig für eine permanente Durchsuchung der Daten, die man für Datenreplizierung oder ETL-Prozesse (Extract, Transform, Load) braucht. Dies ist zum Beispiel für das Laden von Daten in Programme wie Snowflake, Bigquery, Redshift oder Synapse notwendig.

Datameer Spectrum ist für einen weiteren Schritt der Konstruktion von Datenmodellen und Analysen vorgesehen. Dabei werden Daten in Pipelines weitertransportiert zu den Orten oder Software-Plattformen, an denen sie bearbeitet und analysiert werden. Datameer-CEO George Shahid erläutert dazu: "Wir haben Spectrum als Management-Lösung für komplexe Data Pipelines in den Unternehmen entwickelt. Solche Tools werden für Security-Probleme, Compliance mit Regulierungen und Gesetzen sowie für eine generelle Governance des Umgangs mit den Daten gebraucht." Ausserdem muss der Datentransport zu Cloud-Angeboten von AWS, Microsoft Azure oder Google Cloud geregelt und überwacht werden.

Die bis jetzt bekannt gegebenen Preismodelle fūr die neuen Lösungen sehen eine jährliche Subskription mit Basispreisen vor, die Kapazität soll keine Rolle spielen. Vorgesehen sind ferner eine intensive Zusammenarbeit mit Anbietern wie Snowflake, Fivetran, Alterix und anderen. In der Vergangenheit dominierte der Direktverkauf, nun soll das Partnergeschäft stark zunehmen. Mit Google und Amazon werde derzeit über eine erweiterte Kooperation verhandelt.

CEO Shahid betont, dass man bereits in diesem Jahr mit den neuen Produkten die Gewinnzone erreichen werde. Allerdings setzen die meisten der ungefähr 100 Kunden erst das bisherige Hauptprodukt Datameer X ein, das mit einem Hadoop Data Lake bei der Analyse von strukturierten und unstrukturierten Daten zusammenarbeitet. Dies soll so einfach funktionieren wie die Arbeit mit einer Tabellenkalkulation, heisst es bei Datameer. Es bleibt abzuwarten, wie schnell sich die neuen Produkte Spectrum und Spotlight mit ihrer Betonung auf dem Cloud-Einsatz am Markt durchsetzen werden.

Auf seiner Webseite bietet der Hersteller zahlreiche Beispiele für den Kundeneinsatz seiner Lösungen. Interessant sind auch die zahlreichen direkten Vergleiche mit Konkurrenzprodukten, zum Beispiel "Datameer Spectrum versus Talend" oder "Datameer Spotlight versus Amazon Athena".

Datameer:
- Gegründet: 2009 (ursprünglich in Halle, Deutschland; hier befindet sich heute noch die Produktentwicklung)
- Grūnder: Stefan Groschupf; CEO: George Shahid, VP Product: Frank Henze, VP Engineering: Matt McManus
- Firmensitz: San Francisco
- Unternehmenszweck: "Den Kunden bei ihrem Ozean aus Daten oder ihrem 'data-meer' helfen"
- Gesamte Funding-Gelder bisher: 115 Millionen Dollar
- Investoren: Redpoint, Kleiner Perkins, STTelemedia, Nextworld, Workday, Toptier, Citiventures, S Software
- Technologie-Partner: Google Cloud, AWS, Microsoft Azure, Snowflake, Tableau, Cloudera, HPE, MAPR, IBM (zu Beginn auch Hortonworks, als der Fokus mehr auf Hadoop lag)
- Kunden: Aus der Gruppe der Fortune 100, besonders bei Banken und Finanzdienstleistungen mit ihren staatlichen Vorgaben und Regulierungen

Die Datameer Cloud Plattform (Bild: zVg)
Die Datameer Cloud Plattform (Bild: zVg)
Bild: zVg
Bild: zVg
Fortune-100-Kunden (Bild: zVg)
Fortune-100-Kunden (Bild: zVg)
Datammeer-CEO George Shahid (Bild. zVg)
Datammeer-CEO George Shahid (Bild. zVg)