Universitat Politècnica de Catalunya. Departament d'Estadística i Investigació Operativa
DOCTORAT EN ESTADÍSTICA I INVESTIGACIÓ OPERATIVA (Pla 2012)
(English) Nowadays, Bicycle Sharing Systems (BSS) have become a popular and widespread transportation system across the world thanks to their multiple environmental and health benefits, and its successful support for urban transport. The quantity of data produced by BSS is massive and not all the cities have the resources, expertise, or tools needed to analyze this information and make the most of it. Therefore, the objective of this dissertation is to evaluate the primary challenges faced by both users (customers and supervisors) of BSS and develop a comprehensive set of tools that facilitate the extraction of insights, thereby improving the overall experience when dealing with BSS. Given that the level of maturity and data available differ in each system, we concentrated in public BSS that have fixed docking stations displayed around the city, and selected three systems to be analyzed: i) a small one located in Logroño, Spain; ii) a medium BSS in Barcelona, Spain and iii) a large system in New York, U.S. We conducted a extensive analysis to gain a thorough understanding of the requirements and needs of both user groups in Barcelona and Logroño. Unfortunately, due to geographical distance and mobility restrictions resulting from the COVID-19 pandemic, establishing collaboration with the New York BSS was not possible. Based on these findings, we developed new analysis tools that can be classified into two distinct categories: Visual Analytics and Statistical and Machine Learning. The Visual Analytics part focuses on the creation of four web-based visual tools to address users' requirements. Two of these tools cater to the needs of managers and system operators in small and medium size BSS, given the varying needs of systems with different size. Smaller systems often require a higher level of station-level granularity, while larger systems benefit from the analysis of stations in groups. The third tool was designed with a focus on meeting the common needs of customers. These three visual tools are versatile and can be adapted to different BSS. The fourth tool serves as a valuable resource for anyone interested in comparing the output of prediction algorithms. The statistical and machine learning techniques were used to enhance the prediction accuracy of bike arrivals and departures. Firstly, we assess the scalability of prediction techniques by using data from the three selected BSS (small, medium, large). To accomplish this, we employed six distinct machine learning algorithms to determine the adaptability of prediction models to systems with varying usage and size characteristics. Secondly, we conducted a feature importance analysis of several features, including geographical, spatial, weather, and station characteristics, that may influence bike arrivals and departures. Given the availability of data, our focus was on the Barcelona BSS. Through the development of web-based visual tools and the application of statistical and machine learning techniques, valuable insights and improvements have been made in areas such as data analysis, prediction algorithms, and system optimization. The findings presented in this thesis contribute to the understanding of BSS dynamics, provide practical solutions for system management, and enhance the overall user experience. By bridging the gap between data analysis and practical applications, this research serves as a valuable resource for policymakers, operators, and researchers in the pursuit of more efficient analysis of BSS and lays the foundation for future advancements and innovations in sustainable urban mobility.
(Español) Actualmente, los sistemas de bicicletas compartidas (BSS) se han extendido en todo el mundo y su popularidad ha incrementado gracias a sus múltiples beneficios ambientales y para la salud, y su exitoso apoyo al sistema de transporte urbano. La cantidad de datos producidos por estos sistemas es enorme y no todas las ciudades tienen los recursos, la experiencia o las herramientas necesarias para analizar esta información y aprovecharla al máximo. Por lo tanto, el objetivo de esta tesis es evaluar los principales desafíos que enfrentan los usuarios (clientes y supervisores) de los BSS y desarrollar un conjunto completo de herramientas que faciliten la extracción y análisis de esta información. Dado que el nivel de madurez y los datos disponibles difieren en cada sistema, nos concentramos en los BSS públicos que tienen estaciones fijas distribuidas por la ciudad. Hemos seleccionado tres sistemas: i) un BSS pequeño ubicado en Logroño, España; ii) un BSS mediano en Barcelona, España y iii) un sistema grande en Nueva York, EE.UU. Además, hemos realizado un análisis exhaustivo para obtener una comprensión profunda de los requisitos y necesidades de ambos grupos de usuarios en Barcelona y Logroño. Lamentablemente, debido a la distancia geográfica y las restricciones de movilidad derivadas de la pandemia de COVID-19, no fue posible establecer una colaboración con los usuarios de Nueva York. En base a estos hallazgos, desarrollamos nuevas herramientas de análisis que se pueden clasificar en dos categorías: análisis visual y aprendizaje estadístico y machine learning. La parte de análisis visual se centra en la creación de cuatro herramientas visuales. Dos de estas herramientas satisfacen las necesidades de los administradores y operadores de los BSS de tamaño pequeño y mediano, considerando sus necesidades particulares: los sistemas más pequeños a menudo requieren un mayor nivel de granularidad, mientras que los sistemas más grandes se benefician del análisis de estaciones en grupos. La tercera herramienta fue diseñada para satisfacer las necesidades comunes de los clientes de los BSS. Estas tres herramientas visuales son versátiles y pueden ser adaptadas fácilmente a otros BSS. La cuarta herramienta creada sirve como un recurso para cualquier persona interesada en comparar los resultados de diferentes algoritmos de predicción. Las técnicas estadísticas y de machine learning se utilizaron para mejorar la precisión de la predicción de llegadas y salidas de bicicletas en cada estación. En primer lugar, evaluamos la escalabilidad de las técnicas de predicción mediante el uso de datos de los tres BSS seleccionados (pequeño, mediano, grande). Se han usado seis algoritmos de predicción para probar la adaptabilidad de estos a sistemas con diferentes características de uso y tamaño. En segundo lugar, se realizó un análisis de la importancia de las variables consideradas en la predicción, incluidas variables geográficas, espaciales, climáticas y características particulares de la estación, que pueden influir en las llegadas y salidas de bicicletas. Dada la disponibilidad de datos, en esta sección se usaron datos de Barcelona. A lo largo del desarrollo de esta tesis se han realizado mejoras y se han aportado conocimientos valiosos en áreas como el análisis de datos, los algoritmos de predicción y la optimización de BSS. Los hallazgos presentados en esta tesis contribuyen a la comprensión de la dinámica de uso de los BSS, brindan soluciones prácticas para su administración y mejoran la experiencia general de los usuarios. Al cerrar la brecha entre el análisis de datos y las aplicaciones prácticas, esta investigación sirve como un recurso valioso para operadores e investigadores que buscan realizar un análisis más eficiente de los BSS y sienta las bases para futuros avances e innovaciones en la movilidad urbana sostenible.
51 - Matemàtiques; 71 - Urbanisme. Paisatgisme, parcs i jardins
Àrees temàtiques de la UPC::Matemàtiques i estadística; Àrees temàtiques de la UPC::Urbanisme