Winter Term 2018/2019
Masterprojekt Ähnlichkeitssuche in Multimedia-Daten (Teil 1)
Masterprojekt Ähnlichkeitssuche in Multimedia-Daten (Teil 1)
General Information
Course number | 64-865-P1 |
Course type | Master project |
Lecturer | Dr. Fabian Panse |
Time | Fr 12-14 |
Topic
In Zeiten von youtube, instagram und co wächst die Anzahl an öffentlich verfügbaren Multimedia-Datenobjekten wie Videos, Fotos oder Audio-Dateien enorm. Dabei kann es von Nutzen sein, diese Datenmengen gezielt zu durchsuchen. Tag-basierte Suchen sind einfach, aber nur bedingt zielführend, da ein großer Anteil der vorhandenen Datenobjekte solche Tags nicht besitzt.
Eine andere Vorgehensweise ist daher, alle zu einem gegebenen Objekt ähnlichen Objekte zu finden. Diese Instanz-basierte Suche ist allerdings alles andere als trivial, da sie einen Vergleich komplexer Datenobjekte beinhaltet. Dieser Vergleich findet dabei für gewöhnlich nicht direkt auf den einzelnen Objekten, sondern aus zuvor extrahierten Signaturen statt. Offen ist hierbei, welche Extraktionsmethoden für welche Objektarten besonders hilfreich sind. Weitere Fragen ergeben sich bzgl. der Wahl eines geeigneten Ähnlichkeitsmaßes (z.B. Earth Movers Distance) und welche Anfrageform (Bereichs-, k-Nächste Nachbarn- etc.) man verwenden will. Zu guter Letzt erfordert eine große Menge an Datenobjekten, dass Methoden (z. B. Verwendung von Filtermethoden oder Indexierung) Einsatz finden um die Ausführungszeit in annehmbaren Größen zu halten.
In diesem Projekt werden die einzelnen Schritte, die bei der Implementierung einer solchen Ähnlichkeitssuche notwendig sind, durchlaufen. Zunächst werden verschiedene Methoden zur Signaturbildung betrachtet. Anschließend werden verschiedene Ähnlichkeits- und Distanzmaße unter die Lupe genommen. Zusätzlich kann jedes Projektteam auf ein oder zwei Anfrageformen fokussieren und dazu passende Filter- und Indexierungsmethoden implementieren. Des Weiteren gibt es die Möglichkeit neue und eigene Ideen zu verfolgen.
In times of youtube, instagram and co, the number of available multimedia data objects such as videos, photos or audio files is growing enormously. It can be useful to search through these data volumes in a targeted manner. Tag-based searches are simple, but only partially useful because a large part of the existing data objects do not have such tags. A different procedure is therefore to find all objects similar to a given query object. However, this instance-based search is anything but trivial because it contains a comparison of complex data objects. This comparison is usually not applied on the individual objects, but on previously extracted signatures. Here it is not clear which extraction methods are particularly useful for which object types. Further questions arise regarding the choice of a suitable similarity measure (e. g. Earth Movers Distance) and which query form (range-, k-next neighbours-, etc.) somebody wants to use. Last but not least, searching in a large number of data objects requires methods (e. g. filter- or indexing methods) to keep the execution time within acceptable limits.
In this project the individual steps, which are necessary for the implementation of such a similarity search, are run through. First, different methods for signature creation are considered. Then different similarity and distance measures are examined. In addition, each project team can focus on one or two query forms and implement appropriate filtering and indexing methods. Furthermore, there is the possibility consider new and own ideas.
In diesem Projekt werden die einzelnen Schritte, die bei der Implementierung einer solchen Ähnlichkeitssuche notwendig sind, durchlaufen. Zunächst werden verschiedene Methoden zur Signaturbildung betrachtet. Anschließend werden verschiedene Ähnlichkeits- und Distanzmaße unter die Lupe genommen. Zusätzlich kann jedes Projektteam auf ein oder zwei Anfrageformen fokussieren und dazu passende Filter- und Indexierungsmethoden implementieren. Des Weiteren gibt es die Möglichkeit neue und eigene Ideen zu verfolgen.
In times of youtube, instagram and co, the number of available multimedia data objects such as videos, photos or audio files is growing enormously. It can be useful to search through these data volumes in a targeted manner. Tag-based searches are simple, but only partially useful because a large part of the existing data objects do not have such tags. A different procedure is therefore to find all objects similar to a given query object. However, this instance-based search is anything but trivial because it contains a comparison of complex data objects. This comparison is usually not applied on the individual objects, but on previously extracted signatures. Here it is not clear which extraction methods are particularly useful for which object types. Further questions arise regarding the choice of a suitable similarity measure (e. g. Earth Movers Distance) and which query form (range-, k-next neighbours-, etc.) somebody wants to use. Last but not least, searching in a large number of data objects requires methods (e. g. filter- or indexing methods) to keep the execution time within acceptable limits.
In this project the individual steps, which are necessary for the implementation of such a similarity search, are run through. First, different methods for signature creation are considered. Then different similarity and distance measures are examined. In addition, each project team can focus on one or two query forms and implement appropriate filtering and indexing methods. Furthermore, there is the possibility consider new and own ideas.
Procedure
Das Projektmodul besteht aus dem integrierten Seminar 64-865 S und dem Projektteil 64-865 P1, welcher im nachfolgenden Sommersemester fortgeführt wird (WiSe: 2 SWS Integriertes Seminar + 2 SWS Projekt. SoSe: 4 SWS Projekt).
Learning target
Erwerb eines fundierten Überblicks über aktuelle Methoden der Ähnlichkeitssuche in Multimedia-Daten und die zugrundeliegenden Konzepte / Technologien.
Literature
Wird zu Beginn der Veranstaltung bekannt gegeben.
Debug Info for generation of "last modified"teachingCourse_470 (2018-09-03 10:53:45) | teachingCourse_470 (2018-09-03 10:56:58) | teachingCourse_470 (2018-10-11 15:51:10) | teachingCourse_470 (2018-10-11 15:54:59) | teachingCourse_470 (2018-10-11 16:01:01) | teachingCourse_470 (2018-10-11 16:12:05) | teachingCourse_470 (2018-10-11 16:14:05) | teachingCourse_470 (2018-10-11 16:15:17) | teachingCourse_470 (2018-10-11 16:16:41) | persons_1052 (2007-11-01 13:06:00) | persons_1052 (2019-03-14 16:27:01) | persons_1052 (2022-11-07 15:36:18) | teachingCourse_470 (2018-09-03 10:53:45) | teachingCourse_470 (2018-09-03 10:56:58) | teachingCourse_470 (2018-10-11 15:51:10) | teachingCourse_470 (2018-10-11 15:54:59) | teachingCourse_470 (2018-10-11 16:01:01) | teachingCourse_470 (2018-10-11 16:12:05) | teachingCourse_470 (2018-10-11 16:14:05) | teachingCourse_470 (2018-10-11 16:15:17) | teachingCourse_470 (2018-10-11 16:16:41) | teachingCourse_470 (2018-09-03 10:53:45) | teachingCourse_470 (2018-09-03 10:56:58) | teachingCourse_470 (2018-10-11 15:51:10) | teachingCourse_470 (2018-10-11 15:54:59) | teachingCourse_470 (2018-10-11 16:01:01) | teachingCourse_470 (2018-10-11 16:12:05) | teachingCourse_470 (2018-10-11 16:14:05) | teachingCourse_470 (2018-10-11 16:15:17) | teachingCourse_470 (2018-10-11 16:16:41) | teachingCourse_470 (2018-09-03 10:53:45) | teachingCourse_470 (2018-09-03 10:56:58) | teachingCourse_470 (2018-10-11 15:51:10) | teachingCourse_470 (2018-10-11 15:54:59) | teachingCourse_470 (2018-10-11 16:01:01) | teachingCourse_470 (2018-10-11 16:12:05) | teachingCourse_470 (2018-10-11 16:14:05) | teachingCourse_470 (2018-10-11 16:15:17) | teachingCourse_470 (2018-10-11 16:16:41) | teachingCourse_470 (2018-09-03 10:53:45) | teachingCourse_470 (2018-09-03 10:56:58) | teachingCourse_470 (2018-10-11 15:51:10) | teachingCourse_470 (2018-10-11 15:54:59) | teachingCourse_470 (2018-10-11 16:01:01) | teachingCourse_470 (2018-10-11 16:12:05) | teachingCourse_470 (2018-10-11 16:14:05) | teachingCourse_470 (2018-10-11 16:15:17) | teachingCourse_470 (2018-10-11 16:16:41) | persons_1052 (2007-11-01 13:06:00) | persons_1052 (2019-03-14 16:27:01) | persons_1052 (2022-11-07 15:36:18)
7. November 2022 at 15:36 by Dr. Fabian PanseCALL getCollectionFull('teaching/coursekvv','vsis',470,0)