Learned Data Compression

Die Gruppe Learned Data Compression hat sich zum Ziel gesetzt, die grundlegende Architektur der visuellen Datendarstellung zu revolutionieren. Im Gegensatz zu herkömmlichen Komprimierungsverfahren, die auf manuell erstellten Pipelines basieren, strebt diese Gruppe einen Paradigmenwechsel hin zu durchgängig optimierten Systemen an, bei denen jede Komponente aus Daten gelernt wird.

Ein wichtiger Aspekt dieser Forschung ist die nichtlineare Transformationscodierung – eine bahnbrechende Methodik, die von der Leitung der Gruppe entwickelt wurde. Diese Technik ersetzt herkömmliche lineare Transformationen (wie die diskrete Kosinustransformation oder Wavelets) durch nichtlineare, Ende-zu-Ende trainierte neuronale Netze. Dieser innovative Ansatz legte den Grundstein für den JPEG-AI-Standard, der 2025 fertiggestellt wurde. Aufbauend auf diesem Erfolg erforscht die Gruppe Verbesserungen, Verallgemeinerungen und alternative Ansätze zu etablierten Komprimierungswerkzeugen wie Quantisierung und Entropiekodierung, die über die Grenzen hinausgehen, die Shannons fundamentale Arbeit zur Quellenkodierung annahm.

Die zweite Säule der Forschung der Gruppe ist das Verständnis des menschlichen Sehvermögens. Maschinelles Lernen bietet auch das Potenzial, komplexere Modelle der visuellen Wahrnehmung zu entwickeln – indem es Aspekte davon imitiert, wie Menschen das Sehen lernen. Die Gruppe nutzt diese Modelle, um besser vorherzusagen, wie Menschen die Qualität gerenderter Bilder wahrnehmen. Diese verbesserten Qualitätsmaße führen wiederum zu deutlich verbesserten Algorithmen für die Komprimierung visueller Medien.