Mit der Gründung der Forschungsgruppe Learned Data Compression stärkt die Abteilung Videokommunikation und Applikationen (VCA) des Fraunhofer HHI (Fraunhofer-Institut für Nachrichtentechnik, Heinrich-Hertz-Institut) ihre Aktivitäten im Bereich KI-basierter Bild- und Videokompression. Die Gruppe wird von Prof.in Dr.-Ing. Jona Ballé geleitet, einer international anerkannten Expertin für lernbasierte Kompression und Modelle der visuellen Wahrnehmung. „Wir sind sehr stolz darauf, Jona Ballé als eine der weltweit führenden Pionierinnen auf dem Gebiet der nichtlinearen Transformationscodierung (NTC) in unser Team aufnehmen zu können“, sagt Dr. Detlev Marpe, Abteilungsleiter von VCA. „Ihre wegweisenden wissenschaftlichen Arbeiten haben maßgeblich zur Entwicklung des 2025 finalisierten JPEG AI Standards beigetragen.“
„Zunächst einmal ist es toll, wieder in Deutschland zu sein! Ich freue mich darauf, Berlin zu erkunden, was ich schon immer einmal tun wollte“, sagt Jona Ballé. Nach mehreren Jahren als Staff Research Scientist bei Google Research und einer anschließenden Professur an der NYU Tandon School of Engineering kommt sie nun für ihre neue Aufgabe ans Fraunhofer HHI. Ihre wissenschaftliche Laufbahn begann an der RWTH Aachen, wo sie ihre Promotion mit summa cum laude abschloss und bereits früh an innovativen Verfahren der Bildkompression arbeitete.
Im Zentrum der neuen VCA-Forschungsgruppe steht das Ziel, die Architektur visueller Datendarstellung grundlegend neu zu denken. Anstelle klassischer, konventionell entworfener Komprimierungsverfahren setzt die Forschung der Gruppe auf maschinell optimierte Systeme, bei denen jede Komponente vollständig aus Daten gelernt wird. Ein Schlüsselkonzept ist die von Frau Ballé seit 2016 entwickelte nichtlineare Transformationscodierung, die traditionelle lineare Transformationen wie die diskrete Kosinustransformation (DCT) oder Wavelets durch trainierbare neuronale Netze ersetzt. „Wir streben einen Paradigmenwechsel hin zu Ende-zu-Ende optimierten Systemen an“, erklärt sie. Aufbauend auf den Erfolgen von NTC sollen etablierte Werkzeuge wie Quantisierung und Entropiekodierung neu durchdacht und die grundlegenden Annahmen der klassischen Quellenkodierung hinterfragt werden.
Ein zweiter Forschungsschwerpunkt liegt auf Modellen des menschlichen Sehvermögens. Maschinelles Lernen eröffnet hier die Möglichkeit, komplexere, biologisch inspirierte Wahrnehmungsmodelle zu entwickeln, die präziser vorhersagen, wie Menschen Bildqualität beurteilen. „Maschinelles Lernen bietet enormes Potenzial, komplexere Modelle der visuellen Wahrnehmung zu entwickeln – indem es Aspekte der Art und Weise imitiert, wie Menschen das Sehen lernen“, so Frau Ballé. Diese Erkenntnisse sollen direkt in neue, qualitativ verbesserte Kompressionsverfahren einfließen.
„Noch mehr freue ich mich darauf, mit einigen der besten Leute im Bereich Videokompression zusammenzuarbeiten und einige der neuartigen Ideen, die ich in den letzten Jahren erforscht habe, in die Praxis umzusetzen“, betont Prof.in Ballé. Mit ihrer Expertise und der neuen Gruppe stärkt das Fraunhofer HHI seine Position als führender Forschungsstandort für Bild- und Videokompression und schafft wichtige Impulse für zukünftige Anwendungen in Streaming, XR, Kommunikationstechnologien und visueller Qualitätssicherung.
Weitere Informationen finden Sie hier.