Alexander Alten, CEO Scalytics (Bild: zVg)

Scalytics mit dem Firmensitz in Miami, USA, hat sich zur Aufgabe gemacht, den Unternehmen ein "AI Learning System" zur Verfūgung zu stellen. Seine vor kurzem vorgestellte neue Lösung "Scalytics Connect 1.2" soll es den Unternehmen ermöglichen, "transparentes, skalierbares und effizientes Machine Learning" einzusetzen. Diese Zielsetzung verdeutlichte Alexander Alten, CEO und einer der Gründer von Scalytics, auf einer Veranstaltung der IT Press Tour auf der Mittelmeerinsel Malta.

Besonderer Wert soll auf Konsistenz und Sicherheit von Firmendaten gelegt werden. Scalytics (eine Wortschöpfung aus "Scale" und "Analytics") basiert auf einfach einzusetzender Artificial Intelligence (AI), mit der die Anwender ihre dezentralen und fragmentierten Daten auf eine alternative und sichere Weise verwalten können. Gegründet wurde das Unternehmen im Jahr 2020 in Deutschland und hat seinen Firmensitz jetzt in Miami, USA.

Das Framework von Scalytics Connect verwendet AI, um den Kunden kontinuierlch erweiterte Funktionen und Anwendungsmöglichkeiten zur Verfūgung zu stellen – insofern eine permanente Solution in Progress, wie es jede vernūnftige Anwendung praktiziert. Scalytics setzt dazu auf einer Enterprise Distribution von Apache Wayang auf. Dieses "meta-processing Framework" hat bereits mit über einer Million Downloads eine grosse Verbreitung gefunden (https://wayang.apache.org). Verwendet werden u.a. Apache Spark, PostgreSQL, Apache Flink, Java Streams und JOBC.

Die Marktbeobachter von Crunchbase beschreiben Scalytics wie folgt: "Das Unternehmen bietet eine robuste Grundlage für den Betrieb von AI-Agenten. Diese funktionieren in Container-Umgebungen, verarbeiten Daten lokal und geben nur die notwendigen Ergebnisse für gemeinsame Aufgaben wie zum Beispiel Modelltraining oder erweiterte Datenabfragen frei." (www.crunchbase.com/organization/scalytics).

Kunden können sich, so Alten, auf die Entwicklung von AI-Anwendungen in Echtzeit konzentrieren, während sich Scalytics um die notwendige Infrastruktur und komplexe Integrationen kümmert. Die hauptsächlichen Aufgaben bestehen darin, dezentralisierte Daten miteinander zu verbinden, ihre Verwaltung zu vereinfachen und die Entwicklung von AI-Funktionen zu beschleunigen. Die Kunden werden so in die Lage versetzt, verteilte Datenverarbeitung zu vereinfachen und nachvollziehbares maschinelles Lernen mit verschiedenen AI-Datenquellen in die Praxis umzusetzen.

Alten ergänzt in diesem Zusammenhang: "Wir legen mit unserem Ansatz die Grundlage für den skalierbaren und transparenten Einsatz von AI. Anwender können auf dieser Grundlage schrittweise weitere Verbesserungen ihrer Infrastruktur durchführen." Laut Alten gibt es in diesem Zusammenhang bereits konkrete Kooperationen mit NTT Data und Google Cloud.

Besonderer Wert wird auf RAG-Fähigkeiten (Retrieval Augmented Generation) gelegt. Vorgefertigte Modelle in Kombination mit RAG-Techniken finden immer mehr Verbreitung. RAG ist ein neuer Ansatz, der besonders genaue und zuverlässige Antworten liefert, indem vorab trainierte Sprachmodelle mit besonderen Organisationsinformationen ergänzt werden. Dieser Ansatz ermöglicht es Unternehmen, schneller genau und datengestützte Inhalte für viele Geschäftsbereiche wie zum Beispiel Marketing, Produktentwicklung oder Personalwesen zu erstellen. (Siehe hierzu auch den Artikel "From RAG to fine-tuning, data management enriches AI results" auf https://blocksandfiles.com.)

Scalytics beansprucht, mit seinem dezentralisierten Data Processing und den AI-Funktionen die laufenden Kosten für Unternehmen zu reduzieren. Allen ergänzt dazu: "Das bedeutet, dass sie neben geringeren Betriebskosten auch Compliance zu Datenregulierungen wie zum Beispiel jene von GDPR, HIPAA oder den EU-Regelungen zu AI erzielen können."

Scalytics verfügt derzeit über Mitarbeiter in den USA, Deutschland, Dänemark und Indien. Auf der Tagesordnung stehen jetzt erste Kooperationen mit Systemintegratoren und Managed Service Providern in mehreren europäischen Ländern.

Auf seiner Web-Seite bietet der Hersteller eine Reihe von Videos, Tutorials und White Papers an. Einige Videos sind auch auf Youtube zu sehen. Weitere Informationen auf: www.scalytics.io/resources.

Probleme bei der Skalierung von Artificial Intelligence (AI) und Machine Learning (ML)
OpenAI, Google und Anthropic stehen trotz erheblicher Investitionen vor Herausforderungen bei der Entwicklung fortgeschrittener AI-Modelle. Die Dominanz grosser Technologieunternehmen aufgrund umfangreicher Daten-Ressourcen schafft eine digitale Kluft. Unterstütztes Machine Learning (FedML) bietet hierfür eine Lösung, indem es kleinen Organisationen ermöglicht, fortgeschrittene Modelle durch dezentralisierte Daten und datenschutz-orientierte Zusammenarbeit zu trainieren. Diese Technologie kann die Vorteile von AI allgemein zugänglich machen und Größenunterschiede verringern.

Darüber hinaus ist die derzeitige AI-Entwicklung auf Unternehmensebene mit Hindernissen konfrontiert, die traditionelle zentralisierte Ansätze zunehmend ineffizient machen. Hierzu gehören:
1. Datenschutz und Vorschriften:
Gesetze wie GDPR und HIPAA schränken die Übertragung und Zentralisierung von sensiblen Daten ein. Das Verschieben grosser Datensätze über Grenzen oder Plattformen hinweg bringt zusätzliche Komplexität und Compliance-Risiken mit sich.
2. Fragmentierung der Daten:
Unternehmen haben oft mit silo-artigen Daten zu tun, die über mehrere Standorte, Systeme und Plattformen verstreut sind. Die Konsolidierung dieser Daten für zentrale Schulungen ist kostspielig und oft ineffizient.
3. Engpässe bei den Ressourcen:
Zentralisiertes Modelltraining erfordert beträchtliche Rechen-Ressourcen, was zu Leistungsbeschränkung und wachsenden Kosten bei der Infrastruktur führen kann.
4. Mangelnde Transparenz:
Mit der Skalierung von AI-Systemen werden die Nachvollziehbarkeit von Trainingsprozessen und die Transparenz von Modellen immer wichtiger: Nur so sind Vertrauen und Verantwortungsbewusstsein in der Praxis zu vermitteln.

(Quelle: www.scalytics.io/blog/federated-learning-scalable-secure-ai; siehe auch McKinsey, A data leader’s operating guide to scaling gen AI - September 12, 2024: www.mckinsey.com/capabilities/mckinsey-digital/our-insights/a-data-leade...)

Bild: Screenshot
Bild: Screenshot