Forscher des Instituts für Informationssysteme der Hochschule Hof (IISys) verbessern die Zähl-Kompetenz von KI-Modellen mit ihrem neuen Datensatz "Situate". Statt auf reale Fotos zu setzen, erzeugen die Forscher künstliche 3D-Szenen mit klar definierten Eigenschaften.
"Wir wollten eine Umgebung schaffen, in der wir genau kontrollieren können, was im Bild passiert - und was nicht", so IISys-Forscher René Peinl. In den so geschaffenen Szenen befänden sich geometrische Objekte wie Würfel, Kugeln oder Zylinder und Positionen seien eindeutig festgelegt, sodass sich gezielt Fragen stellen liessen, etwa nach Farbe, Anzahl oder Ort der Objekte. So entstehe ein Trainingsumfeld, das nicht auf Zufällen basiere.
Neben einfachen Antworten werden auch ausführliche Erklärungen genutzt, bei denen die KI Schritt für Schritt beschreibt, was sie sieht und wie sie zählt. Ein Beispiel: "Auf dem Tisch sind zwei Objekte, daneben drei - insgesamt also fünf." Dieser "Chain-of-Thought"-Ansatz zeigt Wirkung. "Wir sehen, dass die Modelle durch diese strukturierte Herangehensweise deutlich besser werden, wenn es um komplexere Zählaufgaben geht", verdeutlicht Peinl.
Allerdings hat auch diese Methode Grenzen: Bei kleinen Zahlen neigt die KI mit dieser Logik dazu, zusätzliche Objekte "hinzuzudichten", um ihrer eigenen Linie treu zu bleiben. Die Experimente zeigen: KI-Modelle, die mit "Situate" trainiert wurden, verallgemeinern besser. "Eine Kombination verschiedener Datensätze liefert in den Testreihen die besten Ergebnisse. Wir sehen aber: Die Art des Trainings beeinflusst stark, wie die KI denkt", berichtet Peinl.
Die Modelle zeigen laut dem Experten Verhaltensmuster, die an Menschen erinnern. Kleine Mengen werden schnell erfasst, grössere erfordern strukturierte Strategien", so Peinl. Gleichzeitig werde deutlich, dass KI häufig keine "echte" Zahlvorstellung entwickle, sondern visuelle Muster lerne. KI-Forschung hänge somit nicht nur von immer grösseren Modellen ab. Die Experten sehen vielerlei Einsatzoptionen in der Industrie, der Medizin oder der Logistik.
