thumb

Eine Datenbank mit über 14 Millionen Fotos, deren Motive von Menschen identifiziert wurden, ermöglicht enorme Fortschritte in der maschinellen Bilderkennung, wie die New York Times berichtet. Seit 2009 haben über 300 wissenschaftliche Publikationen die Datenbank Imagenet erwähnt oder für empirische Forschung verwendet.

In der Regel sind Algorithmen, die auf die Sammlung zurückgreifen, doppelt so effizient beim Erkennen von Bildinhalten wie andere Systeme. Auch auf anderen Gebieten hat die Bilderkennung in den vergangenen Jahren Fortschritte gemacht. Bei der schier unglaublichen Menge an Bilddaten im Netz ist das auch dringend nötig.

"Für Bildersuche gibt es bereits erste Anwendungsfälle für den Normalverbraucher. Eine Suche nach Bildern von Autos ist auch in einer Menge unbeschrifteter Bilder möglich. Für die jüngsten Fortschritte gibt es drei Hauptgründe: Verbesserte Algorithmen zur Mustererkennung, die Bilder identifizieren, dazu schnellere Netzwerke, die es erlauben, Bilder zur Untersuchung an Server zu schicken und Crowdsourcing, das die Erstellung von Vergleichsdatenbanken ermöglicht hat", sagt Fachmann Michael Gervautz im Gespräch mit pressetext.

Dass Computer lernen, Bilder zu erkennen, ist wichtig, da die enorme Bilder- und Videoflut im Netz, die täglich anschwillt, ansonsten nicht mehr beherrschbar ist. Ohne maschinelle Suche würde das Internet "dunkel werden", so Fei-Fei Li, einer der Urheber von Imagenet. Computer können Bildinhalte von sich aus aber nicht erkennen. Dass Menschen sämtliche Motive identifizieren, ist schlicht unmöglich. Imagenet ermöglicht einen Zwischenweg. Die 17 Mio. Bilder, die alle möglichen Motive zeigen, wurden allesamt mittels Amazons Crowdsourcing-Plattform "Mechanical Turk" von Menschen beschrieben und in inhaltliche Kategorien eingeteilt.

Jedes Jahr tragen so 20.000 bis 30.000 Menschen gegen eine geringe finanzielle Entschädigung einen kleinen Teil zum Ausbau der Datenbank bei. Damit ist Imagenet die mit Abstand grösste Ressource ihrer Art. Die Bilder sind in 21.841 verschiedene Kategorien unterteilt. Algorithmen können sich markante Bereiche in den Fotos merken und so eine Vergleichsmöglichkeit schaffen, die es erlaubt, die Motive von unbekannten Fotos zu klassifizieren.

"Perfekt ist die momentan aktuelle Technologie noch lange nicht. Bilder mit wenigen eindeutigen Merkmalen lassen sich beispielsweise kaum erkennen. Es wird aber daran gearbeitet", sagt Gervautz. Die Leistungsfähigkeit von Systemen, die Imagenet verwenden, ist auch heute schon beeindruckend. Ein Bilderkennungsalgorithmus, den ein Doktorand von Li entwickelt hat, wird scherzhaft bereits als unfehlbar bezeichnet. Der Trick: Die Software verallgemeinert seine Antworten, wenn die verfügbare Information nicht ausreicht. Soll das Programm das Bild eines Hasen erkennen, erkennt das System je nach Möglichkeit vielleicht nur ein Säugetier oder gar ein Tier.