dc.contributor
Universitat Autònoma de Barcelona. Departament de Ciències de la Computació
dc.contributor.author
Codevilla Moraes, Felipe
dc.date.accessioned
2019-07-17T11:40:34Z
dc.date.available
2020-05-20T02:00:11Z
dc.date.issued
2019-05-21
dc.identifier.isbn
9788449087226
en_US
dc.identifier.uri
http://hdl.handle.net/10803/667238
dc.description.abstract
Els vehicles autònoms es consideren ara com a actius assegurats en el futur. Literalment,
tots els marcadors d’automòbils rellevants es troben en una cursa per produir
vehicles totalment autònoms. Aquests fabricants de cotxes solen fer ús de canonades
modulars per al disseny de vehicles autònoms. Aquesta estratègia descompon
el problema en diverses tasques com la detecció i el reconeixement d’objectes, la
segmentació semàntica i la instància, l’estimació de profunditat, el reconeixement
de llocs i SLAM, així com la planificació i el control. Cada mòdul requereix un conjunt
separat d’algoritmes experts, que són costosos especialment quant al treball
humà i la necessitat d’etiquetatge de dades. Una alternativa que recentment té
un interès significatiu és la conducció integral. En el paradigma de conducció de
extrem a extrem, la percepció i el control s’obtenen simultàniament mitjançant una
xarxa profunda. Els models de tesisensorotor s’obtenen normalment mitjançant
l’aprenentatge de imitacions de les demostracions de humà. L’avantatge principal
és que aquest enfocament pot aprendre directament de les grans flotes de vehicles
dirigits per humans sense necessitat d’un ontologia fixa i d’una àmplia quantitat
d’etiquetatge. No obstant això, els mètodes de extrem a extrem es van utilitzar
habitualment per aprendre conductes simples com ara manteniment de carrils
i el vehicle principal. En aquesta tesi, per tal d’aconseguir comportaments més
complexos, abordemalguns problemes quan es crea un sistema de conducció de
extrem a extrem mitjançant l’aprenentatge de la imitació. El primer d’aquests és la
necessitat d’un entorn per a l’avaluació d’algorismes i la recopilació de demostracions
d’administració. En aquest sentit, hem participat en la creació del simulador de
Carla, una plataforma de codi obert construïda des de la base per a la validació i el
prototipatge d’autònoms. Atès que l’enfocament de extrem a extrem és purament
re-actiu, també hi ha la necessitat de proporcionar una interfície amb un sistema de
planificació global. Amb això, proposem l’aprenentatge d’imitació condicional que
condiciona les accions produïdes en algun comandament d’alt nivell. L’avaluació
és també una qüestió i normalment es fa mitjançant la comparació de la sortida de
la xarxa de cap a cap a un conjunt de dades de conducció que es recull. Demostrem
que això és correlacionat sorprenentment debilitat amb la conducció real i proposa
estratègies sobre com adquirir millor les dades i una estratègia de comparació
millor. Finalment, confirmem problemes de generalització ben coneguts (deguts a
biaixos i sobraccessos actuals), de nous (a causa d’objectes dinàmics i la manca de
model acausal) i la inestabilitat de la formació; Els problemes que requereixen més
investigacions abans de finalitzar la conducció a través de la imitació poden escalar
a la conducció del món real.
en_US
dc.description.abstract
Autonomous vehicles are now considered as an assured asset in the future. Literally,
all the relevant car-markers are now in a race to produce fully autonomous
vehicles. These car-makers usually make use of modular pipelines for designing
autonomous vehicles. This strategy decomposes the problemin a variety of tasks
such as object detection and recognition, semantic and instance segmentation,
depth estimation, SLAM and place recognition, as well as planning and control.
Each module requires a separate set of expert algorithms, which are costly specially
in the amount of human labor and necessity of data labelling. An alternative that recently
has driven considerable interest is the end-to-end driving. In the end-to-end
driving paradigm, perception and control are learned simultaneously using a deep
network. These sensorimotor models are typically obtained by imitation learning
from human demonstrations. The main advantage is that this approach can directly
learn from large fleets of human-driven vehicles without requiring a fixed ontology
and extensive amounts of labeling. However, scaling end-to-end driving methods to
behaviors more complex than simple lane keeping or lead vehicle following remains
an open problem. On this thesis, in order to achieve more complex behaviours, we
address some issues when creating end-to-end driving system through imitation
learning. The first of themis a necessity of an environment for algorithm evaluation
and collection of driving demonstrations. On this matter, we participated on the
creation of the CARLA simulator, an open source platformbuilt from ground up for
autonomous driving validation and prototyping. Since the end-to-end approach
is purely reactive, there is also the necessity to provide an interface with a global
planning system. With this, we propose the conditional imitation learning that
conditions the actions produced into some high level command. Evaluation is also
a concern and is commonly performed by comparing the end-to-end network output
to some pre-collected driving dataset. We show that this is surprisingly weakly
correlated to the actual driving and propose strategies on how to better acquire data
and a better comparison strategy. Finally, we confirmwell-known generalization issues
(due to dataset bias and overfitting), new ones (due to dynamic objects and the
lack of a causal model), and training instability; problems requiring further research
before end-to-end driving through imitation can scale to real-world driving.
en_US
dc.format.extent
130 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
eng
en_US
dc.publisher
Universitat Autònoma de Barcelona
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-nd/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Conducció autònoma
en_US
dc.subject
Conducción autónoma
en_US
dc.subject
Autonomous driving
en_US
dc.subject
Visió per computador
en_US
dc.subject
Visión por computador
en_US
dc.subject
Computer vision
en_US
dc.subject
Aprenentatge màquina
en_US
dc.subject
Aprendizaje máquina
en_US
dc.subject
Machine learning
en_US
dc.subject.other
Ciències Experimentals
en_US
dc.title
On building end-to-end driving models through imitation learning
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.contributor.authoremail
fcodevilla@cvc.uab.cat
en_US
dc.contributor.director
López Peña, Antonio M. (Antonio Manuel)
dc.embargo.terms
12 mesos
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess