Durch den Vormarsch der künstlichen Intelligenz steigen auch die Anforderungen an Hardware, speziell an die Kühlung leistungsstarker KI-Chips in Rechenzentren. Microsoft hat in Zusammenarbeit mit dem Schweizer Startup Corintis mit "Mikrofluidik" nun eine neue Kühltechnich entwickelt. Dabei werden winzige Mengen Flüssigkeit durch extrem feine Kanäle, die dünner als ein menschliches Haar sind, direkt im Siliziumchip zu den heissesten Stellen geführt. Dies ermögliche eine deutlich effizientere Wärmeabfuhr als herkömmliche Methoden, so die beiden Unternehmen.
Die Entwickler setzen künstliche Intelligenz ein, um die speziellen Wärmesignaturen auf einem Chip zu identifizieren und das Kühlmittel präziser zu lenken. Die meisten GPUs, die in heutigen Rechenzentren betrieben werden, werden derzeit mit Kühlplatten gekühlt, die durch mehrere Schichten von der Wärmequelle getrennt sind. Dies begrenzt die abzuführende Wärmemenge. Und jede neue Generation von KI-Chips, die leistungsfähiger werden, wird mehr Wärme erzeugt. Stützt man sich weiterhin auf die traditionelle Kühlplattentechnologie, so stehen die Hersteller in fünf Jahren an, meint Sashi Majety, Senior Technical Program Manager für Cloud Operations and Innovation bei Microsoft.
Die Tests von Microsoft im Labor zeigten, dass Mikrofluidik bei der Wärmeabfuhr bis zu dreimal besser abschneidet als Kühlplatten, abhängig von der Arbeitslast und den beteiligten Konfigurationen. Die Mikrofluidik reduzierte auch den maximalen Temperaturanstieg des Siliziums in einer GPU um 65 Prozent, obwohl dies je nach Art des Chips variieren kann. Das Entwicklungsteam rechnet auch damit, dass die neue Kühltechnologie zudem die Effektivität des Stromverbrauchs verbessern werde, eine wichtige Kennzahl zur Messung der Energieeffizienz eines Rechenzentrums, und die Betriebskosten senken würde.
Grundsätzlich ist Mikrofluidik allerdings kein neues Konzept, aber es in der Praxis zum Laufen zu bringen, war die grosse Herausforderung. "Systemisches Denken ist entscheidend bei der Entwicklung einer Technologie wie der Mikrofluidik. Sie müssen die Systeminteraktionen zwischen Silizium, Kühlmittel, Server und dem Rechenzentrum verstehen, um das Beste daraus zu machen", betont Husam Alissa, Director of Systems Technology in Cloud Operations and Innovation bei Microsoft. Allein die richtigen Grooves hinzubekommen, sei schwierig. Die Abmessungen des Mikrokanals entsprächen einem menschlichem Haar, was bedeute, dass es keinen Spielraum für Fehler gebe.
Im Rahmen der Prototyping-Bemühungen arbeitete Microsoft mit dem Schweizer Startup Corintis zusammen. Mit der von Corintis entwickelten künstliche Intelligenz (KI) konnte das bioinspirierte Design dahingehend optimiert werden, um die Hotspots der Chips effizienter zu kühlen als direkte Auf- und Ab-Kanäle, die sie ebenfalls getestet wurden. Das Bio-Design ähnelt gemäss den Forschern den Adern eines Blattes oder eines Schmetterlingsflügels. Die Natur zeige am besten die effizientesten Wege auf, um Kühlflüssigkeit zu verteilen.
Es musste zudem sichergestellt werden, dass die Kanäle tief genug sind, um eine ausreichende Menge an Kühlflüssigkeit zirkulieren lassen zu können, ohne zu verstopfen. Gleichzeitig durften sie wiederum nicht so tief sein, dass das Silizium so geschwächt wird und zu bersten droht. Allein im vergangenen Jahr habe das Team vier Design-Iterationen durchgespielt.
Die Mikrofluidik erforderte auch die Entwicklung eines auslaufsicheren Gehäuses für den Chip, die Suche nach der besten Kühlmittelformel, das Testen verschiedener Ätzmethoden und die Entwicklung eines Schritt-für-Schritt-Prozesses für das Hinzufügen von Ätzen zur Herstellung der Chips.
In einem nächsten Schritt will Microsoft nun erproben, wie die mikrofluidische Kühlung in zukünftige Generationen seiner First-Party-Chips integriert werden könne. Man werde weiter mit Fertigungs- und Siliziumpartnern zusammenarbeiten, um die Mikrofluidik für Rechenzentren in Produktion zu bringen.
Der Online-Stellenmarkt für ICT Professionals
