Seitdem AlexNet 2012 die ImageNet Challenge gewonnen und den State-of-the-Art im Bereich Computer Vision deutlich verbessert hat, ist die Forschung im Bereich Bildklassifikation und Objekterkennung explodiert und tiefe neuronale Netze sind in immer mehr Anwendungen zu finden. Obwohl die genannten Aufgaben seit des sogenannten ImageNet Moments als aus Forschungssicht weitgehend gelöst gelten, bleiben genügend praktische Anwendungsgebiete, für die es auch 2021 keine befriedigenden Erkennungslösungen gibt.
Qualitätsmängel an Produkten in der Produktion sind je nach Beleuchtungssituation z.T. selbst durch menschliche Experten nur schwer auf Bildern zu erkennen und deutlich leichter zu identifizieren, wenn man das Produkt in Händen halten und von allen Seiten inspizieren kann, so dass das Licht ggfs. Kratzer oder andere Mängel bei günstiger Einstrahlung optisch hervorhebt. Bei Fotos aus mehreren Perspektiven ist zwar das Produkt von allen Seiten erfasst, die Lichteinstrahlung ist aber nur jeweils von einer Seite. Zudem sind die Mängel im Vergleich zum Gesamtprodukt von der Fläche her evtl. sehr klein und werden durch die für die Weiterverarbeitung notwendige Reduktion der Bildauflösung ggfs. nicht mehr erkennbar. Es müssen also geschickte Vorverarbeitungsschritte unternommen wer-den, um die Aufgabenstellung mit den prinzipiell gut geeigneten Deep Learning Verfahren lösen zu können. Weiterhin muss untersucht werden, ob sich eher Bildklassifizierungsalgorithmen zur Einteilung Gutteil / Ausschuss oder Objekterkennungsalgorithmen zum Finden von Mängeln eignen. Weiterhin muss untersucht werden, wie sich mit der geringen Menge an Trainingsdaten für Produkte mit Mängeln ein maschinelles Lernverfahren anlernen lässt und auf welchen vortrainierten Netzen man ggfs. aufbauen kann.
Im Projekt wurde ein ein Objekterkennungsnetz entwickelt, die Ersatzteile für Maschinen basierend auf Fotos identifizieren kann und der Allgemeinheit als Open Source Software zur Verfügung gestellt wird.