Universitat Autònoma de Barcelona. Departament de Ciències de la Computació
Els vehicles autònoms es consideren ara com a actius assegurats en el futur. Literalment, tots els marcadors d’automòbils rellevants es troben en una cursa per produir vehicles totalment autònoms. Aquests fabricants de cotxes solen fer ús de canonades modulars per al disseny de vehicles autònoms. Aquesta estratègia descompon el problema en diverses tasques com la detecció i el reconeixement d’objectes, la segmentació semàntica i la instància, l’estimació de profunditat, el reconeixement de llocs i SLAM, així com la planificació i el control. Cada mòdul requereix un conjunt separat d’algoritmes experts, que són costosos especialment quant al treball humà i la necessitat d’etiquetatge de dades. Una alternativa que recentment té un interès significatiu és la conducció integral. En el paradigma de conducció de extrem a extrem, la percepció i el control s’obtenen simultàniament mitjançant una xarxa profunda. Els models de tesisensorotor s’obtenen normalment mitjançant l’aprenentatge de imitacions de les demostracions de humà. L’avantatge principal és que aquest enfocament pot aprendre directament de les grans flotes de vehicles dirigits per humans sense necessitat d’un ontologia fixa i d’una àmplia quantitat d’etiquetatge. No obstant això, els mètodes de extrem a extrem es van utilitzar habitualment per aprendre conductes simples com ara manteniment de carrils i el vehicle principal. En aquesta tesi, per tal d’aconseguir comportaments més complexos, abordemalguns problemes quan es crea un sistema de conducció de extrem a extrem mitjançant l’aprenentatge de la imitació. El primer d’aquests és la necessitat d’un entorn per a l’avaluació d’algorismes i la recopilació de demostracions d’administració. En aquest sentit, hem participat en la creació del simulador de Carla, una plataforma de codi obert construïda des de la base per a la validació i el prototipatge d’autònoms. Atès que l’enfocament de extrem a extrem és purament re-actiu, també hi ha la necessitat de proporcionar una interfície amb un sistema de planificació global. Amb això, proposem l’aprenentatge d’imitació condicional que condiciona les accions produïdes en algun comandament d’alt nivell. L’avaluació és també una qüestió i normalment es fa mitjançant la comparació de la sortida de la xarxa de cap a cap a un conjunt de dades de conducció que es recull. Demostrem que això és correlacionat sorprenentment debilitat amb la conducció real i proposa estratègies sobre com adquirir millor les dades i una estratègia de comparació millor. Finalment, confirmem problemes de generalització ben coneguts (deguts a biaixos i sobraccessos actuals), de nous (a causa d’objectes dinàmics i la manca de model acausal) i la inestabilitat de la formació; Els problemes que requereixen més investigacions abans de finalitzar la conducció a través de la imitació poden escalar a la conducció del món real.
Autonomous vehicles are now considered as an assured asset in the future. Literally, all the relevant car-markers are now in a race to produce fully autonomous vehicles. These car-makers usually make use of modular pipelines for designing autonomous vehicles. This strategy decomposes the problemin a variety of tasks such as object detection and recognition, semantic and instance segmentation, depth estimation, SLAM and place recognition, as well as planning and control. Each module requires a separate set of expert algorithms, which are costly specially in the amount of human labor and necessity of data labelling. An alternative that recently has driven considerable interest is the end-to-end driving. In the end-to-end driving paradigm, perception and control are learned simultaneously using a deep network. These sensorimotor models are typically obtained by imitation learning from human demonstrations. The main advantage is that this approach can directly learn from large fleets of human-driven vehicles without requiring a fixed ontology and extensive amounts of labeling. However, scaling end-to-end driving methods to behaviors more complex than simple lane keeping or lead vehicle following remains an open problem. On this thesis, in order to achieve more complex behaviours, we address some issues when creating end-to-end driving system through imitation learning. The first of themis a necessity of an environment for algorithm evaluation and collection of driving demonstrations. On this matter, we participated on the creation of the CARLA simulator, an open source platformbuilt from ground up for autonomous driving validation and prototyping. Since the end-to-end approach is purely reactive, there is also the necessity to provide an interface with a global planning system. With this, we propose the conditional imitation learning that conditions the actions produced into some high level command. Evaluation is also a concern and is commonly performed by comparing the end-to-end network output to some pre-collected driving dataset. We show that this is surprisingly weakly correlated to the actual driving and propose strategies on how to better acquire data and a better comparison strategy. Finally, we confirmwell-known generalization issues (due to dataset bias and overfitting), new ones (due to dynamic objects and the lack of a causal model), and training instability; problems requiring further research before end-to-end driving through imitation can scale to real-world driving.
Conducció autònoma; Conducción autónoma; Autonomous driving; Visió per computador; Visión por computador; Computer vision; Aprenentatge màquina; Aprendizaje máquina; Machine learning
62 - Ingeniería. Tecnología
Ciències Experimentals