User: Guest  Login
Original title:
Grounding Natural Language to 3D Scenes
Translated title:
Verankerung Natürlicher Sprache in 3D-Szenen
Author:
Chen, Zhenyu
Year:
2024
Document type:
Dissertation
Faculty/School:
TUM School of Computation, Information and Technology
Advisor:
Nießner, Matthias (Prof. Dr.)
Referee:
Nießner, Matthias (Prof. Dr.); Elhoseiny, Mohamed H. (Prof. Dr.)
Language:
en
Subject group:
DAT Datenverarbeitung, Informatik
TUM classification:
DAT 760; DAT 750; DAT 708
Abstract:
Grounding natural language to 3D scenes is an essential research topic for many upcoming interactive robotic agents or AR/VR applications. In recent years, there has been tremendous breakthroughs in segmenting objects in images from language. However, these methods and datasets are restricted to 2D views, where the 3D extent of an object and its surrounding environment are incompletely modelled. This limitation hinders applications where it is critical to understand the complete 3D context and t...     »
Translated abstract:
Das Verankern von natürlicher Sprache in 3D-Szenen ist ein wichtiges Forschungsthema für viele interaktive Roboteragenten oder AR/VR-Anwendungen. In den letzten Jahren gab es enorme Durchbrüche bei der Segmentierung von Objekten in Bildern aus der Sprache heraus. Diese Methoden und Datensätze beschränken sich jedoch auf 2D-Ansichten, in denen die 3D-Ausdehnung eines Objekts und seiner Umgebung unvollständig modelliert sind. Diese Begrenzung hindert Anwendungen, bei denen es entscheidend ist, den...     »
WWW:
https://mediatum.ub.tum.de/?id=1709387
Date of submission:
22.05.2023
Oral examination:
22.03.2024
File size:
34554333 bytes
Pages:
199
Urn (citeable URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20240322-1709387-1-0
Last change:
18.04.2024
 BibTeX