Universitat Autònoma de Barcelona. Programa de Doctorat en Informàtica
Aquesta tesi es centra en l’ús de l’anàlisi de textures per a sistemes de lectura robustos. En aquesta tesi es explora l’ús de l’anàlisi de textures per a imatges de text. Es presenta una anàlisi en profunditat de descriptor de “Local Binary Pattern” (LBP). Els descriptors d’LBP s’utilitzen en la detecció de paraules i assoleixen el màxim rendiment entre els mètodes sense aprenentatge. Es desenvolupa una variant anomenada Sparse Radial Sampling LBP per explotar les propietats úniques del text i s’utilitza per aconseguir un rendiment d’estat d’art en la identificació d’escriptors. Els mateixos descriptors de característiques s’utilitzen juntament amb models de xarxes neuronals profundes per abordar amb èxit el problema de la identificació de l’escriptura i el llenguatge en múltiples modalitats.
Esta tesis se centra en el uso del análisis de texturas para sistemas de lectura robustos. En esta tesis se explora el uso del análisis de texturas para imágenes de texto. Se presenta un análisis en profundidad del descriptor de "Local Binary Pattern" (LBP). Los descriptores de LBP se utilizan en la detección de palabras y logran el máximo rendimiento entre los métodos sin aprendizaje. Se desarrolla una variante llamada Sparse Radial Sampling LBP para explotar las propiedades únicas del texto y se utiliza para lograr un rendimiento de estado de arte en la identificación de escritores. Los mismos descriptores de características se utilizan junto con modelos de redes neuronales profundas para abordar con éxito el problema de la identificación de la escritura y el lenguaje en múltiples modalidades.
This thesis focuses on the use of texture analysis for Robust Reading Systems. In this thesis the use of texture analysis for text-images is explored. An in depth analysis of the established Local Binary Pattern (LBP) descriptor is presented. The LBP descriptors are used in word-spotting and achieves top performance among learning-free methods. A custom variant called Sparse Radial Sampling LBP is developed to exploit the unique properties of text and is used to achieve state-of-the-art performance in writer identification. The same feature descriptors are used in conjunction with deep Neural Networks in order to address successfully the problem of script and language identification in multiple modalities.
Visio; Vision; Text; Texto; Artificial
004 - Informàtica
Tecnologies