Bild: Oracle

Der texanische IT-Riese Oracle mit Zentrale in Austin kündigte dieser Tage die allgemeine Verfügbarkeit von Heatwave GenAI an. Der neue Cloud-Datenbankservice umfasse die laut Oracle "branchenweit ersten datenbankinternen Large Language Modelle (LLMs), einen automatisierten datenbankinternen Vektorspeicher, Scale-out-Vektorverarbeitung und die Möglichkeit zum Führen kontextbezogener Gespräche in natürlicher Sprache auf der Grundlage unstrukturierter Inhalte". Mit diesen neuen Funktionen könnten Anwenderfirmen die Effizienzpotentiale generativer Künstlicher Intelligenz (KI) in ihre Unternehmensdaten integrieren, ohne dass KI-Expertise erforderlich sei oder Daten in eine separate Vektordatenbank verschoben werden müssten, verspricht der Larry-Ellison-Konzern.

Heatwave GenAI ist den Angaben zufolge ab sofort in allen Oracle Cloud-Regionen, Oracle Cloud Infrastructure (OCI) Dedicated Region und Cloud-übergreifend ohne zusätzliche Kosten für Heatwave-Kunden verfügbar.

Mit Heatwave GenAI könnten Entwickler mit Hilfe integrierter Embeddings einen Vektorspeicher für unstrukturierte Unternehmensdaten mit einem einzigen SQL-Befehl erstellen, heisst es seitens des texanischen Soft- und Hardware-Herstellers. Darüber hinaus seien Benutzer mithilfe von LLMs in der Datenbank oder externen LLMs in der Lage, in einem einzigen Schritt Suchvorgänge in natürlicher Sprache durchzuführen. Die Daten verlassen demnach die Datenbank nicht und aufgrund der Skalierbarkeit und Performance von Heatwave bestehe keine Notwendigkeit, GPUs bereitzustellen.

Zu den neuen automatisierten und integrierten generativen KI-Funktionen gehören:
- Datenbankinterne LLMs sollen die Entwicklung generativer KI-Anwendungen zu geringeren Kosten vereinfachen. Unternehmen könnten von generativer KI profitieren, ohne sich um die Komplexität der externen LLM-Auswahl und -Integration kümmern zu müssen und ohne sich Gedanken über die Verfügbarkeit von LLMs in den Data Centern verschiedener Cloud-Provider zu machen. Die in die Datenbank integrierten LLMs ermöglichen es demnach den Anwenderfirmen, Daten zu durchsuchen, Inhalte zu generieren oder zusammenzufassen und RAG (Retrieval-Augmented Generation) mit Heatwave Vector Store durchzuführen. Des Weiteren könnten sie generative KI mit anderen integrierten Heatwave-Funktionen wie AutoML kombinieren, um umfangreichere Anwendungen zu erstellen. Heatwave GenAI ist ausserdem in den OCI Generative AI-Service integriert, um auf vorab trainierte, Basismodelle führender LLM-Provider zuzugreifen.
- Mit dem automatisierten, datenbankinternen Vektorspeicher können Anwenderfirmen generative KI mit ihren Geschäftsdokumenten nutzen, ohne Daten in eine separate Vektordatenbank zu verschieben und ohne KI Expertise, so Oracle. Alle Schritte zum Erstellen eines Vektorspeichers und von Vektoreinbettungen werden demnach automatisiert und innerhalb der Datenbank ausgeführt. Das Erkennen von Dokumenten im Objektspeicher, das Parsen, das Generieren von Einbettungen in hochparalleler und optimierter Weise und das Einfügen in den Vektorspeicher würden Heatwave Vector Store effizient und benutzerfreundlich machen, heisst es. Die Verwendung eines Vektorspeichers für RAG helfe, das Problem der Halluzinationen in LLMs zu lösen, da die Modelle proprietäre Daten mit dem entsprechenden Kontext durchsuchen könnetn, um genauere und relevantere Antworten zu liefern.
- Die Scale-Out-Vektorverarbeitung ermögliche es weiters, semantische Suchergebnisse sehr schnell und ohne Einbussen bei der Genauigkeit zu erzielen. Heatwave unterstütze einen neuen, nativen Vector-Datentyp und eine optimierte Implementierung der Distanzfunktion, heisst es, sodass Kunden semantische Abfragen mit Standard-SQL durchführen könnten. Die hybride In-Memory-Darstellung von Spalten und die Scale-out-Architektur von HeatWave ermöglichten die Ausführung von Vektorverarbeitung mit Near-Memory-Bandbreite und Parallelisierung über bis zu 512 Heatwave-Knoten. Dadurch sollen Anwender schnell Antworten auf ihre Fragen erhalten. Die Benutzer könnten die semantische Suche auch mit anderen SQL-Operatoren kombinieren, um z. B. mehrere Tabellen mit unterschiedlichen Dokumenten zu verknüpfen und eine Ähnlichkeitssuche über alle Dokumente durchzuführen.
- Heatwave Chat wiederum ist ein Visual Code-Plug-in für MySQL Shell, das eine grafische Benutzeroberfläche für Heatwave GenAI bereitstellt und Entwicklern ermöglicht, Fragen in natürlicher Sprache oder SQL zu stellen. Der integrierte Lakehouse Navigator ermöglicht Benutzern, Dateien aus dem Objektspeicher auszuwählen und einen Vektorspeicher zu erstellen. Ausserdem könnten Benutzer in der gesamten Datenbank suchen oder die Suche auf einen Ordner beschränken. Heatwave pflege den Kontext mit dem Verlauf der gestellten Fragen, den Zitaten der Quelldokumente und der Aufforderung zum LLM, so die Infos von Oracle. Dies erleichtere eine kontextbezogene Konversation und ermögliche Benutzern, die Quelle der vom LLM generierten Antworten zu überprüfen. Darüber hinaus werde dieser Kontext in Heatwave verwaltet und stehe jeder Anwendung zur Verfügung, die Heatwave verwendet.

"Die technischen Innovationen von Heatwave verwirklichen weiterhin die Vision einer universellen Cloud-Datenbank", kommentiert Holger Müller, Vice President und Principal Analyst bei Constellation Research. Und weiter: "Das Neueste ist generative KI im ‚HeatWave-Stil‘ – einschliesslich der Integration eines automatisierten, datenbankinternen Vektorspeichers und datenbankinterner LLMs direkt in den Heatwave-Kern. Dies ermöglicht Entwicklern, durch die Kombination von Heatwave-Elementen neue Anwendungsklassen zu erstellen. Sie können beispielsweise Heatwave AutoML und Heatwave GenAI in einer Anwendung zur Betrugserkennung kombinieren, die nicht nur verdächtige Transaktionen erkennt, sondern auch eine verständliche Erklärung liefert. Das alles läuft in der Datenbank, sodass die Daten nicht in externe Vektordatenbanken verschoben werden müssen, was die Sicherheit der Daten erhöht. Wie in Benchmarks der Konkurrenz gezeigt wurde, macht es Heatwave GenAI auch zu einem Bruchteil der Kosten hochleistungsfähig."



Der Online-Stellenmarkt für ICT Professionals