Computational model of visual perception: from colour to form

Author

Akbarinia, SeyedArash

Director

Párraga, C. Alejandro

Date of defense

2017-10-02

ISBN

9788449075919

Pages

157 p.



Department/Institute

Universitat Autònoma de Barcelona. Departament de Ciències de la Computació

Abstract

La idea original de este proyecto fue estudiar la importancia del color en el reconocimiento de objetos. Comenzamos extendiendo la investigación previa sobre nombrar colores y demostrando la viabilidad de capturar términos de color a través de elipsoides. Aunque nuestros resultados superaron el estado-del-arte en dos bases de datos, vimos que los fenómenos de luces metaméricas y constancia de color debían ser tratados antes de cualquier procesamiento de color. Nuestra investigación de pares metaméricas mostró que son infrecuentes en el mundo real. Contrariamente a eso, la iluminación de una escena a menudo cambia drásticamente. Abordamos este problema proponiendo un modelo de constancia de color inspirado en la adaptación dinámica del centro-envolvente de las neuronas en la corteza visual. Esto se implementa a través de dos gaussianos asimétricos superpuestos, cuyas varianzas y alturas se ajustan al contraste local. Complementamos este modelo con un mecanismo genérico de agrupación variante por contraste que inversamente conecta el porcentaje de señal agrupada al contraste de una región. Los resultados sobre cuatro bases de datos fueron prometedores: nuestro modelo superó incluso los enfoques basados en el aprendizaje en muchos casos. Alentados por el éxito obtenido, ampliamos este enfoque para detectar los bordes de los objetos. Proponemos un modelo de detección de bordes basado en la primera derivada del kernel gaussiano. Incorporamos cuatro tipos de envolvente: completa, distante, orientación isogonal y ortogonal. Además, contamos con el mecanismo de agrupación en las áreas corticales superiores y la retroalimentación de la forma enviada a las zonas más bajas. Nuestros resultados en tres bases de datos mejoraron el estado-del-arte en los algoritmos sin aprendizaje. En resumen, hemos demostrado que los modelos inspirados biológicamente ofrecen soluciones para visión por computador, como nombrar colores, constancia de color y detección de bordes. Creemos que la mayor contribución de esta tesis doctoral es el modelado del concepto de modulación envolvente dinámica que muestra la importancia de la integración de envolvente variante por contraste. Los modelos propuestos se basan en sólo una parte de lo que sabemos sobre la visión humana. Por lo tanto, es natural complementarlos en trabajos futuros.


La idea original d'aquest projecte va ser estudiar la importància del color al reconeixement d'objectes. Comencem estenent la investigació prèvia sobre l’anomenament de colors i demostrant la viabilitat de capturar termes de color a través d’el·lipsoides. Tot i que els nostres resultats van superar l'estat de l’art utilitzant dues bases de dades, vam veure que els fenòmens de llums metamèriques i constància de color havien de ser tractats abans de qualsevol processament de color. Sobre la nostra investigació de parells metamèriques concloem que són infreqüents en el món real. Contràriament a això, la il·luminació d'una escena sovint canvia dràsticament. Abordem aquest problema proposant un model de constància de color inspirat en l'adaptació dinàmica del centre-envoltant de les neurones al còrtex visual. Això s'implementa a través de dues gaussianes asimètriques superposades, les variàncies i les alçades de les quals s'ajusten amb el contrast local dels píxels. Complementem aquest model amb un mecanisme genèric d'agrupació variant per contrast que connecta inversament el percentatge de senyal agrupada amb el contrast d'una regió. Els resultats sobre quatre bases de dades van ser prometedors: el model proposat superava, en molts casos, els models basats en aprenentatge. Encoratjats per l'èxit obtingut, ampliem aquesta proposta per detectar les vores dels objectes. Proposem un model de detecció de vores basat en la primera derivada del nucli gaussià. Incorporem quatre tipus de voltants: completa, distant, orientació isogonal i ortogonal. A més, comptem amb el mecanisme d'agrupació en les àrees corticals superiors i la retroalimentació de la forma, que és enviada a les zones més baixes. Els nostres resultats en tres bases de dades van millorar l'estat de l’art en els algoritmes sense aprenentatge. En resum, hem demostrat que els models biològicament inspirats ofereixen solucions per a visió per computador, com anomenament de colors, constància de color i detecció de vores. Creiem que la major contribució d'aquesta tesi doctoral és el modelatge del concepte de modulació envoltant dinàmica que mostra la importància de la integració de l’entorn que varia segons el contrast. Els models proposats es basen en una part del que sabem sobre la visió humana. Per tant, és natural complementar-los en treballs futurs.

Keywords

Percepció visual; Percepción visual; Visual perception; Visió per computador; Visión por computador; Computer vision; Modelització biològicament inspirat; Modelización biologicamente inspirado; Biologically inspired modelling

Subjects

004 - Computer science

Knowledge Area

Tecnologies

Documents

seak1de1.pdf

4.400Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)