Für welches Thema interessieren Sie sich?

Die Graphik zeigt, wie Eingabedaten in Form von Bildern an ein Neuronales Netz übergeben werden. Dieses wird mithilfe dieser Daten trainiert und lernt aus den zur Verfügung gestellten Beispielen. Anschließend kann dieses trainierte Neuronale Netz auch für neue Bilddaten angewendet werden um die gewünschte Vorhersage zu tätigen. In diesem Fall ist dies einerseits eine Bewertung der Bildqualität und andererseits ein Ausgabebild in welchem automatisiert gewünschte und anhand der Beispielbilder gelernte, Änderungen im Bild vorgenommen wurden.

Machine Learning Framework zur dynamischen Entscheidung von Bildqualitätskriterien

Kurzbezeichnung: DeepQuality

Fogra-Nr. 13.004
Projektleiter: M. Wimmer (Fogra) und Prof. Dr. D. Merhof (LfB)
Partner: Lehrstuhl für Bildverarbeitung der RWTH Aachen University
Förderung: BMWK (IGF) über AiF
 

Laufzeit: 01.06.2020 - 31.05.2022

Aufgabenstellung und Relevanz

In diesem Forschungsvorhaben wurden Möglichkeiten der Automatisierung des Prozesses der professionellen Bildretusche mit Hilfe von künstlicher Intelligenz (KI) untersucht und entwickelt. Aktuell am Markt verfügbare Tools (Stand 2022) bieten zwar schon vielfältige Möglichkeiten, Bildretusche durch den Einsatz von KI zu vereinfachen und zu beschleunigen, jedoch erzielen diese oft nicht die in der professionellen Bildretusche erforderliche Qualität. Dies liegt maßgeblich an den Datenbeständen, welche für das Training der KI-Modelle verwendet wurden. Hier liegt die große Chance von Firmen der professionellen Bildretusche, welche großes, eigenes und qualitativ sehr hochwertiges Bildmaterial besitzen, das zum Training von KI-Modellen verwendet werden kann. Dieses Forschungsvorhaben zeigt, wie Unternehmen ihren Datenschatz heben können, um firmeninterne KI-Modelle umzusetzen und somit einen Teil ihrer Arbeit zu automatisieren ohne Qualität zu verlieren.

Lösungsweg

In diesem Forschungsvorhaben wurde dargelegt, wie und an welchen Stellen künstliche Intelligenz (KI) den Prozess der Bildretusche vereinfachen, beschleunigen und verbessern kann. Die Qualität der hier verfolgten Ansätze hängt maßgeblich von der zur Verfügung stehenden Datenmenge ab. Ist ihre Qualität eher mittelmäßig, können auch nur mittelmäßige Resultate von KI-Modellen erwartet werden. Wenn jedoch eine ausreichende Menge an Daten in sehr guter Qualität vorliegt, kann andersrum mit sehr guten Ergebnissen der KI-Modelle gerechnet werden. Im besten Fall liegen diese Daten als Bildpaare vor, welche das Motiv vor und nach der Bearbeitung zeigen. In Grenzfällen reicht es gegebenenfalls auch schon aus, Bilder von zwei unterschiedlichen Kategorien zu besitzen, jedoch nicht erzwungenermaßen Bildpaare. Der komplette Ansatz der in diesem Forschungsvorhaben verfolgten Ziele ist also datengetrieben, d.h. die Qualität der erlernten Transformation, steht und fällt mit der Güte der zur Verfügung stehenden Datenmenge.

Bild des Projektleiters Martin Wimmer

Martin Wimmer

Vorstufentechnik

+49 89 431 82 - 411

Kontaktaufnahme

Ansprechpartner

Gerne beantworte ich Ihre Fragen zum Projekt und freue mich auch auf den Austausch mit Ihnen.

Lassen Sie uns in Kontakt treten!

Erzielte Ergebnisse

Die in diesem Forschungsprojekt erreichten Ergebnisse werden in einem ausführlichen Forschungsbericht zur Verfügung gestellt. Außerdem wurde eine WebApp programmiert, welche dem Anwender ein einfaches Testen von speziell trainierten KI-Modellen auf eingenen Bildern ermöglicht.

 

 

Es wird weiter der entwickelte Programmiercode für Jedermann gut zugänglich, online und direkt im Browser ausführbar zur Verfügung gestellt.

Publikationen & Zwischenergebnisse

TitelVersionDatumDateiartHerunterladen
Vortrag PIC-Academy Workshop in Isarlohn V1 15.10.2021 pdf Download