Exploring the role of Text in Visual Question Answering on Natural Scenes and Documents 

    Perez Tito, Ruben (Date of defense: 2023-11-13)

    Visual Question Answering (VQA) és la tasca on donada una imatge i una pregunta en llenguatge natural, l'objectiu és generar una resposta en llenguatge natural. En la intersecció entre la visió per computador i el processament ...