Wintersemester 2018/2019
Integriertes Seminar Ähnlichkeitssuche in Multimedia-Daten
Integriertes Seminar Ähnlichkeitssuche in Multimedia-Daten
Allgemeine Information
Veranstaltungs-Nr. | 64-865-S |
Veranstaltungs-Type | Integriertes Seminar |
Veranstalter | Dr. Fabian Panse, Mareike Schmidt |
Zeit | Fr 14-16 |
Periodizität | unregelmäßig |
Voraussetzungen | Programmierkenntnisse, Grundlagen von Datenbanken |
Inhalt
In Zeiten von youtube, instagram und co wächst die Anzahl an öffentlich verfügbaren Multimedia-Datenobjekten wie Videos, Fotos oder Audio-Dateien enorm. Dabei kann es von Nutzen sein, diese Datenmengen gezielt zu durchsuchen. Tag-basierte Suchen sind einfach, aber nur bedingt zielführend, da ein großer Anteil der vorhandenen Datenobjekte solche Tags nicht besitzt.
Eine andere Vorgehensweise ist daher, alle zu einem gegebenen Objekt ähnlichen Objekte zu finden. Diese Instanz-basierte Suche ist allerdings alles andere als trivial, da sie einen Vergleich komplexer Datenobjekte beinhaltet. Dieser Vergleich findet dabei für gewöhnlich nicht direkt auf den einzelnen Objekten, sondern aus zuvor extrahierten Signaturen statt. Offen ist hierbei, welche Extraktionsmethoden für welche Objektarten besonders hilfreich sind. Weitere Fragen ergeben sich bzgl. der Wahl eines geeigneten Ähnlichkeitsmaßes (z.B. Earth Movers Distance) und welche Anfrageform (Bereichs-, k-Nächste Nachbarn- etc.) man verwenden will. Zu guter Letzt erfordert eine große Menge an Datenobjekten, dass Methoden (z. B. Verwendung von Filtermethoden oder Indexierung) Einsatz finden um die Ausführungszeit in annehmbaren Größen zu halten.
In diesem Projekt werden die einzelnen Schritte, die bei der Implementierung einer solchen Ähnlichkeitssuche notwendig sind, durchlaufen. Zunächst werden verschiedene Methoden zur Signaturbildung betrachtet. Anschließend werden verschiedene Ähnlichkeits- und Distanzmaße unter die Lupe genommen. Zusätzlich kann jedes Projektteam auf ein oder zwei Anfrageformen fokussieren und dazu passende Filter- und Indexierungsmethoden implementieren. Des Weiteren gibt es die Möglichkeit neue und eigene Ideen zu verfolgen.
In times of youtube, instagram and co, the number of available multimedia data objects such as videos, photos or audio files is growing enormously. It can be useful to search through these data volumes in a targeted manner. Tag-based searches are simple, but only partially useful because a large part of the existing data objects do not have such tags. A different procedure is therefore to find all objects similar to a given query object. However, this instance-based search is anything but trivial because it contains a comparison of complex data objects. This comparison is usually not applied on the individual objects, but on previously extracted signatures. Here it is not clear which extraction methods are particularly useful for which object types. Further questions arise regarding the choice of a suitable similarity measure (e. g. Earth Movers Distance) and which query form (range-, k-next neighbours-, etc.) somebody wants to use. Last but not least, searching in a large number of data objects requires methods (e. g. filter- or indexing methods) to keep the execution time within acceptable limits.
In this project the individual steps, which are necessary for the implementation of such a similarity search, are run through. First, different methods for signature creation are considered. Then different similarity and distance measures are examined. In addition, each project team can focus on one or two query forms and implement appropriate filtering and indexing methods. Furthermore, there is the possibility consider new and own ideas.
In diesem Projekt werden die einzelnen Schritte, die bei der Implementierung einer solchen Ähnlichkeitssuche notwendig sind, durchlaufen. Zunächst werden verschiedene Methoden zur Signaturbildung betrachtet. Anschließend werden verschiedene Ähnlichkeits- und Distanzmaße unter die Lupe genommen. Zusätzlich kann jedes Projektteam auf ein oder zwei Anfrageformen fokussieren und dazu passende Filter- und Indexierungsmethoden implementieren. Des Weiteren gibt es die Möglichkeit neue und eigene Ideen zu verfolgen.
In times of youtube, instagram and co, the number of available multimedia data objects such as videos, photos or audio files is growing enormously. It can be useful to search through these data volumes in a targeted manner. Tag-based searches are simple, but only partially useful because a large part of the existing data objects do not have such tags. A different procedure is therefore to find all objects similar to a given query object. However, this instance-based search is anything but trivial because it contains a comparison of complex data objects. This comparison is usually not applied on the individual objects, but on previously extracted signatures. Here it is not clear which extraction methods are particularly useful for which object types. Further questions arise regarding the choice of a suitable similarity measure (e. g. Earth Movers Distance) and which query form (range-, k-next neighbours-, etc.) somebody wants to use. Last but not least, searching in a large number of data objects requires methods (e. g. filter- or indexing methods) to keep the execution time within acceptable limits.
In this project the individual steps, which are necessary for the implementation of such a similarity search, are run through. First, different methods for signature creation are considered. Then different similarity and distance measures are examined. In addition, each project team can focus on one or two query forms and implement appropriate filtering and indexing methods. Furthermore, there is the possibility consider new and own ideas.
Vorgehen
Das Projektmodul besteht aus dem integrierten Seminar 64-865 S und dem Projektteil 64-865 P1, welcher im nachfolgenden Sommersemester fortgeführt wird (WiSe: 2 SWS Integriertes Seminar + 2 SWS Projekt. SoSe: 4 SWS Projekt).
Lernziel
Erwerb eines fundierten Überblicks über aktuelle Methoden der Ähnlichkeitssuche in Multimedia-Daten und die zugrundeliegenden Konzepte / Technologien.
Literatur
Wird zu Beginn der Veranstaltung bekannt gegeben.
Debug Info for generation of "last modified"teachingCourse_471 (2018-09-03 10:59:59) | teachingCourse_471 (2018-10-11 15:54:59) | teachingCourse_471 (2018-10-11 16:04:21) | persons_1052 (2007-11-01 13:06:00) | persons_1052 (2019-03-14 16:27:01) | persons_1052 (2022-11-07 15:36:18) | persons_2290 (2018-06-21 14:53:23) | persons_2290 (2018-10-25 15:04:24) | teachingCourse_471 (2018-09-03 10:59:59) | teachingCourse_471 (2018-10-11 15:54:59) | teachingCourse_471 (2018-10-11 16:04:21) | teachingCourse_471 (2018-09-03 10:59:59) | teachingCourse_471 (2018-10-11 15:54:59) | teachingCourse_471 (2018-10-11 16:04:21) | teachingCourse_471 (2018-09-03 10:59:59) | teachingCourse_471 (2018-10-11 15:54:59) | teachingCourse_471 (2018-10-11 16:04:21) | teachingCourse_471 (2018-09-03 10:59:59) | teachingCourse_471 (2018-10-11 15:54:59) | teachingCourse_471 (2018-10-11 16:04:21) | persons_1052 (2007-11-01 13:06:00) | persons_1052 (2019-03-14 16:27:01) | persons_1052 (2022-11-07 15:36:18)
Am 7. November 2022 um 15:36 von Dr. Fabian PanseCALL getCollectionFull('teaching/coursekvv','dbis',471,0)