Visual Table of Contents Targeted Retrieval of Digital Media



Visual Table of Contents
Erfolgreiches Suchen in digitalen Medien

26. Februar 2010

Fraunhofer Heinrich-Hertz-Institut: Innovative Technologien für die
Video- und Bildsuche

Visual Table of Contents
Erfolgreiches Suchen in digitalen Medien

Am Fraunhofer Heinrich Hertz-Institut wurde im Rahmen des Forschungsprogramms THESEUS ein inzwischen patentiertes Softwaremodul zur Videostrukturerkennung entwickelt. Es segmentiert Videos vollautomatisch in Szenen, Shots und Sub-shots. So können gesuchte Bildsequenzen schnell und präzise gefunden werden.

Bislang gestaltet sich das Auffinden von bestimmten Videoszenen und digitalen Bildern als ein mühseliges Unterfangen. Das neue Such-, Filter und Darstellungsverfahren für multimediale Daten ermöglicht dem Nutzer ein intuitives Durchsuchen von Bild- und Videoarchiven. Die am Fraunhofer Heinrich-Hertz-Institut entwickelten softwarebasierte Anwendungen erfassen die Struktur des Videos und unterteilen es automatisch in seine semantischen Einheiten wie Szenen, Shots und Sub-Shots. Neue Lernverfahren machen die gezielte Suche nach Bildmotiven wie Gebäude, Landschaftsaufnahmen etc. in Bild- und Videoarchiven möglich. Ähnlichkeitsbasierte Suche lässt Gesichter trotz unterschiedlicher Ausrichtung und Positionierung auffinden.

Technischer Hintergrund

Das Softwaremodul erzeugt automatisch Metadaten, die die Grenzen von Szenen, Shots und Subshots beschreiben. Das Softwaremodul ist dadurch in der Lage, die Struktur des Videos zu erkennen. Bei der Shot-Erkennung werden außerdem nicht nur harte Schnitte, sondern auch weiche Übergänge, wie Aus- und Einblendungen, Überblendungen und Wischblenden registriert. Die Software arbeitet erheblich schneller als Echtzeit, sie bietet ein C sowie C++ Interface zur leichten Integration in bestehende Softwareprodukte.

Fachkontakt:

Fraunhofer Heinrich-Hertz-Institut
Interactive Media – Human Factors
Christian Petersohn
Tel +49 30 31002 663

Weitere Informationen

Halle 9 B36
Fraunhofer-Stand

  • 3D-Live-Studio
  • Gestensteuerung
  • THESEUS
    Internet der Dienste

Halle 9 A44
Bundesmionisterium für
Wirtschaft und Technologie
(BMWi)

Halle 16 C39
Next Level 3D

Halle 13
bitkom Broadband World