Human body parts segmentation via stacked and multi-task learning

dc.contributor
Universitat Oberta de Catalunya. Escola de Doctorat
dc.contributor.author
Sánchez Abril, Daniel
dc.date.accessioned
2019-12-18T11:26:08Z
dc.date.available
2019-12-18T11:26:08Z
dc.date.issued
2019-10-09
dc.identifier.uri
http://hdl.handle.net/10803/668169
dc.description.abstract
La segmentació de persones en imatges RGB ha estat un problema central en el camp de la visió per computador. En aquesta tesi abordem el problema mitjançant hand-crafted features en un pipeline de dues etapes tant per segmentació binària com múltiple segmentació de parts del cos. Eines tals com Adaboost, SVM, haar-like features, HOG i GraphCuts entre altres. A més, mirem les diferències entre cascade learning i stacked learning. Finalment, analitzem com combinar diferents tasques, de manera multimodal, per refinar i millorar les prediccions de la segmentació de parts del cos amb 2D, 3D estimació postura i profunditat. Aquesta part està feta utilitzant deep learning.
en_US
dc.description.abstract
La segmentación de personas en imágenes RGB ha sido un problema central en el campo de la visión por computador. En esta tesis abordamos el problema mediante hand-crafted features en un pipeline de dos etapas tanto para segmentación binaria como múltiple segmentación de partes del cuerpo. Herramientas tales como Adaboost, SVM, haar-like features, HOG y GraphCuts entre otros. Además, miramos las diferencias entre cascade learning and stacked learning. Finalmente, analizamos cómo combinar diferentes tareas, de modo multimodal, para refinar y mejorar las predicciones de la segmentación de partes del cuerpo con 2D, 3D estimación postura y profundidad. Esta parte está hecha utilizando deep learning.
en_US
dc.description.abstract
The segmentation of people in RGB images poses a key obstacle in the field of computer vision. In our thesis, we tackle this issue through hand-crafted features in a two-stage pipeline, targeting both binary and multiple body part segmentation. For our purposes, we employ tools such as AdaBoost, support vector machines, Haar-like features, histograms of oriented gradients and graphics. We also address the differences between cascade learning and stacked learning. Finally, we analyse a multimodal approach to combining different tasks, which allows us to improve and refine our predictions concerning the segmentation of body parts using 2D and 3D estimations of posture and depth, a feat made possible thanks to deep learning.
en_US
dc.format.extent
117 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
eng
en_US
dc.publisher
Universitat Oberta de Catalunya
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-sa/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
segmentación
en_US
dc.subject
segmentació
en_US
dc.subject
segmentation
en_US
dc.subject
parts del cos
en_US
dc.subject
partes del cuerpo
en_US
dc.subject
body parts
en_US
dc.subject
stacked learning
en_US
dc.subject
stacked learning
en_US
dc.subject
stacked learning
en_US
dc.subject
multi-tasca
en_US
dc.subject
multi-tarea
en_US
dc.subject
multi-task
en_US
dc.subject.other
Artificial Intelligence
en_US
dc.title
Human body parts segmentation via stacked and multi-task learning
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
004
en_US
dc.contributor.authoremail
dsanchezab@uoc.edu
en_US
dc.contributor.director
Escalera Guerrero, Sergio
dc.contributor.director
Baró Solé, Xavier
dc.embargo.terms
cap
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess


Documents

phd_thesis_dani-1.pdf

12.90Mb PDF

This item appears in the following Collection(s)