Cookie Hinweis

Wir verwenden Cookies, um Ihnen ein optimales Webseiten-Erlebnis zu bieten. Dazu zählen Cookies, die für den Betrieb der Seite notwendig sind, sowie solche, die lediglich zu anonymen Statistikzwecken, für Komforteinstellungen oder zur Anzeige personalisierter Inhalte genutzt werden. Sie können selbst entscheiden, welche Kategorien Sie zulassen möchten. Bitte beachten Sie, dass auf Basis Ihrer Einstellungen womöglich nicht mehr alle Funktionalitäten der Seite zur Verfügung stehen. Weitere Informationen finden Sie in unseren Datenschutzhinweisen .

Essentiell

Diese Cookies sind für die Funktionalität unserer Website erforderlich und können nicht deaktiviert werden.

Name Webedition CMS
Zweck Dieses Cookie wird vom CMS (Content Management System) Webedition für die unverwechselbare Identifizierung eines Anwenders gesetzt. Es bietet dem Anwender bessere Bedienerführung, z.B. Speicherung von Sucheinstellungen oder Formulardaten. Typischerweise wird dieses Cookie beim Schließen des Browsers gelöscht.
Name econda
Zweck Session-Cookie für die Webanalyse Software econda. Diese läuft im Modus „Anonymisiertes Messen“.
Statistik

Diese Cookies helfen uns zu verstehen, wie Besucher mit unserer Webseite interagieren, indem Informationen anonym gesammelt und analysiert werden. Je nach Tool werden ein oder mehrere Cookies des Anbieters gesetzt.

Name econda
Zweck Measure with Visitor Cookie emos_jcvid
Externe Medien

Inhalte von Videoplattformen werden standardmäßig blockiert. Wenn Cookies von externen Medien akzeptiert werden, bedarf der Zugriff auf diese Inhalte keiner manuellen Zustimmung mehr.

Name Youtube
Zweck Externe Medien

Discovering actionable interpretations from raw visual data: from 2D clustering to 3D reconstruction

Watch the video here

In this talk, I will discuss the problem of discovering interpretable and actionable representations of visual data without supervision. I will start by looking at recent approaches such as deep clustering that can learn high-quality image and video representations with no labels. Yet, I will shows that the resulting representations are interpretable only to a limited extent: they often do not map directly to useful concepts or behaviours. Nor it is reasonable to expect a nuanced and informative understanding of images to emerge from simple high-level task such as clustering. I will then suggest that achieving first a lower-level understanding rooted in 2D and 3D geometry may be propaedeutic to developing a more abstract interpretation of visual data without resorting to external supervision. I will discuss some of our recent work on learning the 3D shape of object categories and their correspondences from still images, videos and 3D scans, discussing some of the principles that can be used to design such algorithms. I will also introduce CO3D, a new in-the-wild dataset of videos of 3D objects that can support research in this domain.

Biosketch Andrea Vedaldi

Andrea Vedaldi is Professor of Computer Vision and Machine Learning and a co-lead of the VGG group at the Engineering Science department of the University of Oxford. I research computer vision and machine learning methods to understand the content of images and videos automatically, with little to no manual supervision, in terms of semantics and 3D geometry. I am also the leading author of the VLFeat and MatConvNet computer vision and deep learning libraries.

to top
powered by webEdition CMS