Dynamic OD matrix estimation exploiting ICT traffic measurements

Author

Ros Roca, Xavier

Director

Montero Mercadé, Lídia

Codirector

Barceló Bugeda, Jaime

Date of defense

2021-10-01

Pages

189 p.



Department/Institute

Universitat Politècnica de Catalunya. Departament d'Estadística i Investigació Operativa

Doctorate programs

Estadística i investigació operativa

Abstract

During the last decades, urban mobility has become the main concern for city councils and transportation operators. The main problem is the traffic congestion that easily appears in urban networks, producing negative economic impacts for the associated cost and, what is becoming more relevant from the sustainability point of view. In this context, the transportation operators and planners make use of traffic simulation models that assist their strategic decisions aiming at improving the mentioned problems. The dynamic OD matrices estimation problem is a crucial step in transportation modeling and simulation because they contain the total number of vehicles that are circulating throughout the city, including their origins, destinations, and their departing time and describe the associated mobility patterns in terms of trip distributions. As this information is not directly observable in reality, this problem has been widely studied and many different methodologies have been proposed in order to obtain the suitable OD matrices that reflect the urban mobility of the studied area. The common approach is to use the counting stations data sets to estimate, using a minimization problem, the OD matrices that produce them. This is called the bi-level optimization approach. However, the main problem of this approach is that it is mathematically underdetermined, because many different OD matrices can produce the same traffic counts on certain links of the urban network, but presenting totally different trip distributions that could not correspond to the socio-demographic structure originating them. In this thesis, we address the different studies measuring the structural similarity between the estimated OD matrix and the reliable OD matrices, which are the ground truth OD matrix in synthetic experiments or the historical OD matrix in the real ones. The appearance of new sources of traffic data from the growth of the information and communication technologies (ICT) appeals to the researchers to use it for reducing such underdetermination, adding it to the OD estimation problem. GPS devices are increasingly used by vehicles and a huge volume of data is generated every day that, implicitly, contains information of the traffic state under real conditions. These data can be analyzed and processed in order to clean, filter and extract this information and can be then introduced into the OD estimation problem. Most of the theoretical research since the ICT technologies are available assume implicitly or explicitly that GPS tracking data can be done through a controlled collection process. However, in the practical world, GPS data are supplied by companies that use different data collection policies and constraints imposed by privacy policies, which invalidate some of these theoretical hypotheses. One of the main research aspects of this thesis is to investigate how these commercial data can be used for the OD estimation problem. However, the introduction of such information in the bi-level optimization problem is not direct and many alternatives arise. This thesis proposes a data-driven estimation of the dynamic assignment matrix to introduce the GPS data information to an analytical model, reducing the underdetermination of the problem. Moreover, such estimation replaces the dynamic traffic assignment reducing also the computational effort of the OD estimation problem. As this thesis results from the collaboration between the simulation software company PTV Group and the Universitat Politècnica de Catalunya, all the experiments of this thesis have been carried out in PTV Visum and using the already existing products. Moreover, the results have been analyzed both from the computational performance and from the quality aspect.


Durant les últimes dècades, les externalitats que es deriven de la mobilitat urbana han estat una de les principals preocupacions dels ajuntaments, gestors metropolitans i operadors de transport. El principal problema és la congestió, que fàcilment apareix en infraestructures urbanes i que impacta negativament en la nostra economia i, el que és més greu, en la sostenibilitat del planeta en que vivim. La contaminació i el soroll provocats per la congestió no només afecten nocivament a la qualitat de l’aire, sinó que també afecten la salut ciutadana i mediambiental. En aquest context, els operadors i planificadors de trànsit utilitzen models de planificació i simulació de trànsit que els aporten coneixement per dur a terme decisions estratègiques i operatives que mitiguin els problemes associats a la mobilitat urbana. El problema d’estimació de les matrius origen-destinació (OD) és un tema crucial en la modelització i simulació del trànsit. Aquestes contenen el nombre total de vehicles que circulen per la ciutat, incloent informació sobre els l’origen, destinació i temps de sortida de cadascun en un horitzó temporal. D’aquesta manera, la distribució de viatges definida en les matrius OD descriu el patró de mobilitat de la xarxa. No obstant això, aquesta informació no és directament observable en un cas pràctic real i, per aquest motiu, es tracta d’un problema profundament estudiat. S’han desenvolupat diferents metodologies que procuren obtenir matrius OD apropiades, és a dir, que reprodueixin correctament la mobilitat de la zona estudiada. L’enfoc més comú consisteix en usar dades recollides per sensors de trànsit que compten vehicles en certs punts de la xarxa per estimar les matrius OD mitjançant la resolució d’un problema de minimització. De tota manera, aquest problema complex és altament indeterminat i diferents matrius OD, que representen realitats sociodemogràfiques i patrons de mobilitat diferents, poden reproduir els mateixos comptatges de vehicles en les vies de la xarxa dotades de sensors. Per tant, moltes línies de recerca han usat diferents tipus de dades de transport addicionals, com ara velocitats mitjanes i densitats de flux, per reduir els graus de llibertat del problema. L’estructura d’una matriu OD descriu el nombre de viatges i la forma com es distribueixen espaialment en la xarxa urbana, des del seu origen a la seva destinació, traçant així el patró de mobilitat global de la xarxa d’estudi. Com que dues matrius OD poden generar els mateixos comptatges, és absolutament necessari fer un estudi exhaustiu de la similaritat de les seves estructures. En aquesta tesi, enfoquem les diferents propostes mesurant sempre el grau de similaritat estructural entre la matriu OD estimada i una matriu OD de referència, sent aquesta la matriu OD històrica en casos reals o la matriu fonamental en el cas dels experiments sintètics. L’aparició de noves fonts de dades de trànsit degut al creixement de les tecnologies de la informació i comunicació (TIC) obre noves línies de recerca adreçades a reduir la indeterminació del problema d’estimació de les matrius OD. L’ús d’aparells GPS en vehicles va en augment, fet que contribueix a la generació diària de grans volums de dades. Aquestes contenen, de manera implícita, informació de l’estat del trànsit en condicions reals. Mitjançant un procés de neteja, filtratge i extracció es pot derivar informació del trànsit per a després introduir-la al problema de l’estimació de matrius OD. El conjunt de dades GPS de tipus comercials no permet conèixer el procediment de recol·lecció de dades i, sovint, està subjectes a polítiques de protecció i privacitat que no permeten assumir certes hipòtesis de qualitat i control en relació als orígens i destinacions. En aquesta tesi, investiguem el valor que poden afegir aquests conjunts de dades comercials per a l’estimació de matrius OD. La introducció d’aquestes dades al problema d’optimització binivell no és directa i existeixen diverses alternatives. Els enfocs analítics no permeten introduir directament aquestes dades perquè la relació entres les dades GPS i els fluxos OD no és elemental. Per altra banda, la versatilitat dels mètodes de simulació-optimització permeten usar-los directament, però l’inconvenient és l’esforç computacional associat. Aquesta tesi proposa un model de la matriu dinàmica d’assignacions basat en dades (data-driven) per aprofitar la informació implícita de les dades GPS i reduir, així, la indeterminació del problema. A més, aquesta tècnica substitueix la necessitat de recórrer a un model de simulació y redueix l’esforç computacional del problema. Aquesta tesi és fruit de la col·laboració entre l’empresa de software de simulació PTV Group i la Universitat Politècnica de Catalunya. Tots els experiments d’aquesta tesi han estat implementats en PTV Visum i usant els productes existents. A més, els resultats de la tesi han estat sempre analitzats des d’una doble perspectiva: computacional i de la qualitat. Aquesta última té com a objectiu analitzar la matriu OD pel que fa a la seva similaritat estructural amb la matriu de referència.


Durante las últimas décadas, las externalidades que se derivan de la movilidad urbana han sido una de las principales preocupaciones de los ayuntamientos, gestores metropolitanos, y operadores de tráfico. El principal problema es la congestión, que fácilmente aparece en infraestructuras urbanas y que impacta de forma negativa en nuestra economía y, lo que es más grave, en la sostenibilidad del planeta que habitamos. La contaminación y el ruido provocados por la congestión no solo afectan nocivamente a la calidad del aire, sino que también perjudican la salud ciudadana y medioambiental. En este contexto, los operadores y planificadores de transporte usan modelos de planificación y simulación de tráfico que les aportan conocimiento para tomar decisiones estratégicas y operativas que mitiguen los problemas asociados a la movilidad urbana. El problema de la estimación de las matrices origen-destino (OD) es un tema crucial en la modelización y simulación de tráfico. Éstas contienen el número total de vehículos que circulan por la ciudad, incluyendo información sobre el origen, destino y tiempo de salida de cada uno de los vehículos en un horizonte temporal. De esta manera, la distribución de viajes definida en las matrices OD describe el patrón de movilidad de la red. Aun así, esta información no es directamente observable en un caso práctico real y, por este motivo, se trata de un problema extensamente estudiado. Se han desarrollado diferentes metodologías con el fin de obtener las matrices OD más apropiadas, es decir, aquellas que reproducen adecuadamente la movilidad de la zona estudiada. El enfoque más común consiste en usar datos recogidos por sensores de tráfico que cuentan vehículos en ciertos puntos de la red para estimar las matrices OD mediante la resolución de un problema de minimización. Aun así, este complejo problema es altamente indeterminado y diferentes matrices OD, que representan realidades sociodemográficas y patrones de movilidad distintos, pueden reproducir los mismos conteos de vehículos en las vías de la red dotadas de sensores. Por consiguiente, muchas líneas de investigación han utilizado de forma adicional diferentes tipos de datos de tráfico, como velocidades medias y densidades de flujo, para reducir los grados de libertad del problema. La estructura de una matriz OD describe el número de viajes y la forma como se distribuyen espacialmente en la red urbana, desde su origen hasta su destino, trazando, así, el patrón de movilidad global de la red de estudio. Como dos matrices OD pueden reproducir los mismos conteos, es absolutamente necesario hacer un análisis exhaustivo de la similitud de sus estructuras. En esta tesis, abordamos las diferentes propuestas midiendo siempre el grado de similitud estructural entre la matriz OD estimada y una matriz OD de referencia, siendo ésta la matriz OD histórica en casos reales o la matriz fundamental en el caso de los experimentos sintéticos. La aparición de nuevas fuentes de datos de tráfico debido al crecimiento de las tecnologías de la información y comunicación (TIC) abre nuevas líneas de investigación dirigidas a reducir la indeterminación del problema de estimación de las matrices OD. El uso de aparatos GPS en vehículos va en aumento, hecho que contribuye a la generación diaria de grandes volúmenes de datos. Éstos contienen, de manera implícita, información del estado del tráfico en condiciones reales. Mediante un proceso de limpieza, filtrado, y extracción se puede derivar información del tráfico para luego introducirla en el problema de estimación de matrices OD. El conjunto de datos GPS de tipo comercial no permite conocer el procedimiento de recolecta de datos y, a menudo, está sujeto a políticas de protección y privacidad que no permiten asumir ciertas hipótesis de calidad y control en relación a los orígenes y destinos. En esta tesis, investigamos el valor que pueden añadir estos conjuntos de datos comerciales para la estimación de matrices OD. La introducción de estos datos en el problema de optimización binivel no es directa y existen diferentes alternativas. Los enfoques analíticos no permiten incorporar directamente estos datos puesto que la relación entre los datos GPS y los flujos OD no es elemental. Por otro lado, la versatilidad de los métodos de simulación-optimización permiten usarlos directamente, pero el inconveniente es el esfuerzo computacional asociado. Esta tesis propone un modelo de la matriz dinámica de asignaciones basado en datos (data-driven) para aprovechar la información implícita de los datos GPS y reducir, así, la indeterminación del problema de estimación. Además, esta técnica reemplaza la necesidad de recurrir a un modelo de simulación y reduce el esfuerzo computacional del problema. Esta tesis es fruto de la colaboración entre la empresa de software de simulación PTV Group y la Universitat Politècnica de Catalunya. Todos los experimentos de la tesis han sido implementados en PTV Visum y usando los productos existentes. Además, los resultados de la tesis han sido siempre analizados desde una doble perspectiva: computacional y de calidad. Esta última tiene como objetivo analizar la matriz OD estimada respeto la similitud estructural con la matriz de referencia..

Subjects

311 - Statistics as a science. Statistical theory; 625 - Civil engineering of land transport. Railway engineering. Highway engineering

Knowledge Area

Àrees temàtiques de la UPC::Matemàtiques i estadística

Note

Pla de Doctorats Industrials de la Generalitat de Catalunya

Documents

TXRR1de1.pdf

7.546Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/

This item appears in the following Collection(s)