Für welches Thema interessieren Sie sich?

Machine Learning Framework zur dynamischen Entscheidung von Bildqualitätskriterien

Kurzbezeichnung: DeepQuality

Fogra-Nr. 13.004
Projektleiter: Dr. A. Kraushaar (Fogra) und Prof. Dr. D. Merhof (LfB)
Partner: Lehrstuhl für Bildverarbeitung der RWTH Aachen University
Förderung: BMWi (IGF) über AiF
 

Laufzeit: 01.06.2020 - 31.05.2022

Unterstützen Sie uns mit Ihren Bildern!

Für unser Forschungsvorhaben brauchen wir Beispieldaten. Machen Sie mit und unterstützen Sie uns mit Ihren Bildern, um die Zukunft der künstlichen Intelligenz mitzugestalten! Vertraulichkeit im Umgang mit Ihren Bilddaten ist sichergestellt.

Upload Form

Aufgabenstellung und Relevanz

Die Auswahl geeigneter Bilder für einen gegebenen Bildstil (auch Briefing genannt) aus einer Vielzahl von Ausgangsbildern, z.B. aus einem Foto-Shooting bedeuet für die beteiligten Agentur- bzw. Repro-Mitarbeiter stets einen großen zeiutlichen Aufwand.

Ziel dieses Vorhabens ist die Entwicklung einer Lösung zur automatischen Bewertung von Bilddaten nach anwendungs­spezifischen Bildstilen auf Grundlage künstlicher Intelligenz. Zielgenaue, für einen bestimmten Stil charakteristische Bilddaten (originale und korrigierte Bilder) sind die Basis für die Entwicklung eines neuronalen Netzwerks, das ohne eine formalisierte (menschliche) Beschreibung des jeweiligen Geschmacks bzw. Bildstils eine dynamische Bildqualitäts­bewertung ermöglicht. Die Bewertung erfolgt derart, dass beliebige Bilder für ein gegebenes Ausgabeverfahren automatisch dahingehend überprüft werden, ob sie einem bestimmten Bildstil entsprechen, und wie viel Aufwand ggf. für eine nötige Retusche (Bildkorrektur) veranschlagt wird („Ampelsystem“). 

Arbeitshypothese ist, dass „Image-to-Image-Translation“ sowie „Image-to-Feature-Translation“ in der Lage sind, ein solches Ampelsystem zu entwickeln. Da die Entscheidungen nach der Eignung von Bilddaten bereits von Experten manuell getroffen werden, stehen ausreichend Trainingsdaten zu Verfügung. Dieser Ansatz basiert im Weiteren auf der Hypothese, dass die Erkennung der relevanten Merkmale für die graduelle Übereinstimmung mit einem Bildstil ausreicht, um diesen Stil erfolgreich auf neue Bilder anzuwenden – und diese somit automatisch zu korrigieren. Dieser letzte Schritt ist besonders anspruchsvoll und stellt die größte Herausforderung innerhalb des Vorhabens dar.

Dr. Andreas Kraushaar

Abteilungsleiter Vorstufentechnik

+49 89 431 82 - 335

Kontaktaufnahme

Ansprechpartner

Gerne beantworte ich Ihre Fragen zum Projekt und freue mich auch auf den Austausch mit Ihnen.

Lassen Sie uns in Kontakt treten!

Lösungsweg

Zu Beginn des Vorhabens wird eine Webseite sowie ein Upload-Bereich für die Übermittlung der Testbilder bzw. Bildpaare (originale und korrigierte Bilder) erstellt. Anschließend werden Anwendungsbereiche diskutiert, die eine Einteilung bzw. Kategorisierung der Bilder in passende Bildstile bzw. Genres ermöglichen. Damit wird dann ein Schema entwickelt, wie die Daten konkret den KI-Netzen „präsentiert“ werden (Datenormalisierung).

Mit den Bilddaten werden daraufhin Trainings- und Validierungsläufe mit unterschiedlichen Netztopologien durchgeführt. Dabei gilt es so viel Anwendungsverständnis wie möglich aufzubauen, um die KI-Struktur bestmöglich auf ihre Aufgabe hin zu optimieren. 

Danach wird eine Web App zur Verfügung gestellt (und weiterentwickelt), die es den Teilnehmern des PA (Projekbegleitender Ausschuss) ermöglicht, die Kategorisierung und Stilbewertung der vorhandenen KI-Maschinen zu bewerten.

Letztlich soll das Ampelsystem auf Basis der gelernten Bildstile in die Web App eingepflegt und in einem breiten Feldtest untersucht wie verbessert werden.

Angestrebte Ergebnisse

Mithilfe maschinellen Lernens und auf Basis künstlicher Intelligenz soll in diesem Forschungsprojekt die Bewertung der Eignung von Bildern für einen bestimmten Bildstil erleichtert werden. 

Ferner soll eine Web App das Lernen von Merkmalen und Bildstil basierend auf Bilder ermöglichen, die aufgrund des Datenschutzes bzw. fehlender Urheberrechte nicht für die Auswertung verwendet werden können. 

Sitzungsunterlagen

TitelVersionDatumDateiartHerunterladen
Agenda 13.004 27.10.2020 14.10.2020 pdf Download