On Considering Semantics for Multi-image Processing

Xue, Danna

On Considering Semantics for Multi-image Processing

dc.contributor.author

Xue, Danna

dc.date.accessioned

2024-09-16T18:08:04Z

dc.date.available

2024-09-16T18:08:04Z

dc.date.issued

2024-07-11

dc.identifier.uri

http://hdl.handle.net/10803/692144

dc.description.abstract

En el processament de múltiples imatges, l'aprofitament de la informació semàntica és essencial per a operacions conscients del contingut i per assegurar la consistència entre les imatges. Tanmateix, això presenta desafiaments en obtenir dades semàntiques d'alta precisió ràpidament, adaptar la informació semàntica a diferents tasques i mantenir la consistència en els resultats del processament. Aquesta tesi aborda aquests desafiaments mitjançant diversos enfocaments proposats: Segmentació semàntica adaptable: Introduïm un marc flexible per a l'entrenament de models de segmentació semàntica amb destil·lació de coneixements, permetent una adaptació ràpida entre els compromisos de precisió i eficiència. Per millorar encara més la precisió dels models compactes, s'introdueix supervisió de contorns per obtenir millors detalls dels límits dels objectes. Integració semàntica en la recolorització: Explorem la integració de característiques semàntiques en la recolorització múltiples imatges. A més, proposem introduir característiques de noms de colors en l'harmonització del color. Demostrem que la integració de la semàntica millora la consistència i harmonia del color de la imatge, produint millors efectes visuals perceptius. Anàlisi de l'impacte temporal: Investiguem l'impacte de la informació temporal en la qualitat de restauració de múltiples imatges, destacant el compromís entre percepció i distorsió i la importància de l'alineació. Demostrem que el compromís entre percepció i distorsió encara existeix en introduir informació temporal, i que l'alineació empitjora tant la percepció com la distorsió. La nostra anàlisi proporciona una referència per dissenyar algoritmes de restauració de múltiples fotogrames i estratègies de filmació potencials. Cada enfocament contribueix a superar els desafiaments de l'aprofitament de la informació semàntica en el processament de múltiples imatges, amb l'objectiu de millorar tant l'eficiència com l'eficàcia en diverses aplicacions.

dc.description.abstract

En el procesamiento de múltiples imágenes, aprovechar la semántica es esencial para operaciones basadas en el contenido y garantizar la consistencia entre imágenes. Esto presenta desafíos en la obtención rápida de datos semánticos de alta precisión, adaptar la información semántica a diferentes tareas y mantener la consistencia en los resultados. Esta tesis aborda estos desafíos a través de varios enfoques: Segmentación semántica adaptable: Introducimos un marco flexible para entrenar modelos de segmentación semántica con destilación de conocimientos, lo que permite una rápida adaptación entre los compromisos de precisión y eficiencia. Para mejorar aún más la precisión de los modelos compactos, se introduce supervisión de contornos para obtener mejores detalles de los límites de los objetos. Integración semántica en la recoloración: Exploramos la integración de características semánticas en la recolorización de imágenes basado en paletas para mejorar la consistencia del color en múltiples imágenes. Además, proponemos introducir características de nombres de colores en la armonización del color. Demostramos que la integración de semántica mejora la consistencia y armonía del color de la imagen, produciendo mejores efectos visuales perceptuales. Análisis del impacto temporal: Investigamos el impacto de la información temporal en la calidad de restauración de múltiples imágenes, destacando el compromiso entre percepción y distorsión y la importancia de la alineación. Demostramos que el compromiso entre percepción y distorsión todavía existe al introducir información temporal, y que la falta de alineación empeora tanto la percepción como la distorsión. Nuestro análisis proporciona una referencia para diseñar algoritmos de restauración de múltiples fotogramas y estrategias de filmación potenciales. Cada enfoque contribuye a superar los desafíos de aprovechar la información semántica en el procesamiento de múltiples imágenes, para mejorar tanto la eficiencia como la efectividad en diversas aplicaciones de procesamiento de imágenes.

dc.description.abstract

In multi-image processing, leveraging semantic information is essential for content-aware operations and ensuring consistency across images. However, this presents challenges in obtaining high-precision semantic data quickly, tailoring semantic information to different tasks, and maintaining consistency across processing results. This thesis addresses these challenges through several proposed approaches: Slimmable semantic segmentation: We introduce a flexible framework for training semantic segmentation models with knowledge distillation, enabling quick adaptation between accuracy and efficiency trade-offs. To further improve the accuracy of the compact models, boundary supervision is introduced to obtain better object boundary details. Semantic integration in recoloring: We explore the integration of semantic features into palette-based image recoloring to enhance color consistency across multiple images. Moreover, we propose to introduce color naming features in color harmonization. We demonstrate that the integration of semantics improves image color consistency and harmony, producing better perceptual visual effects. Temporal impact analysis: We investigate the impact of temporal information on multi-image restoration quality, highlighting the perception-distortion tradeoff and the importance of alignment. We demonstrate that the perception-distortion tradeoff still exists when introducing temporal information, and misalignment worsens both perception and distortion. Our analysis provides a reference for designing multi-frame restoration algorithms and potential shooting strategies. Each approach contributes to overcoming the challenges of leveraging semantic information in multi-image processing, aiming to enhance both efficiency and effectiveness in various image processing applications.

dc.format.extent

126 p.

dc.language.iso

eng

dc.publisher

Universitat Autònoma de Barcelona

dc.rights.license

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc/4.0/

dc.rights.uri

http://creativecommons.org/licenses/by-nc/4.0/

dc.source

TDX (Tesis Doctorals en Xarxa)

dc.subject

Aprenentatge profund

dc.subject

Deep learning

dc.subject

Aprendizaje profundo

dc.subject

Segmentació semàntica

dc.subject

SEmantic segmentation

dc.subject

Segmentación semántica

dc.subject

Restauració d'imatges

dc.subject

Image restoration

dc.subject

Restauración de imágenes

dc.subject.other

Tecnologies

dc.title

On Considering Semantics for Multi-image Processing

dc.type

info:eu-repo/semantics/doctoralThesis

dc.type

info:eu-repo/semantics/publishedVersion

dc.date.updated

2024-09-16T18:08:03Z

dc.subject.udc

dc.contributor.director

Herranz Arribas, Luis

dc.contributor.director

Zhang , Yanning

dc.contributor.director

Vázquez i Corral, Javier

dc.contributor.tutor

Baldrich i Caselles, Ramon

dc.embargo.terms

cap

dc.rights.accessLevel

info:eu-repo/semantics/openAccess

dc.description.degree

Universitat Autònoma de Barcelona. Programa de Doctorat en Informàtica

Documentos

daxu1de1.pdf

27.66Mb PDF

Este ítem aparece en la(s) siguiente(s) colección(ones)

Programa de Doctorat en Informàtica [89]

Àrea de contingut