Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/87976
Title: A Data-Driven Approach to Mobility Modelling of Urban Spaces: Inferring Commuting Routes and Travel Modes
Other Titles: Abordagem Orientada a Dados para modelação de Mobilidade de Espaços Urbanos: Inferindo Rotas Pendulares e Modos de Transporte
Authors: Pires, Joel Filipe Rogão
Orientador: Bento, Carlos Manuel Robalo Lisboa
Keywords: Registos de Detalhes de Chamadas; Percursos Pendulares; Mineração de Dados; Modos de Transporte; Dados Móveis; Call Detail Records; Commuting Routes; Data Mining; Transportation Modes; Mobile Data
Issue Date: 12-Sep-2019
Serial title, monograph or event: A Data-Driven Approach to Mobility Modelling of Urban Spaces: Inferring Commuting Routes and Travel Modes
Place of publication or event: DEI-FCTUC
Abstract: As cidades estão se tornando cada vez mais um íman para a diversidade, criatividade e bem-estar. Desafios relacionados com o aumento da densidade e complexidade estão sendo abordados pela integração de sistemas computacionais mais inteligentes nos vários níveis do tecido urbano.Os dados desempenham um papel crucial na compreensão dos fluxos urbanos e dos padrões de mobilidade por meio do desenvolvimento de modelos usados para melhorar a rede de transporte, o ambiente social e a segurança nos espaços urbanos. Um tipo de dados usado para alimentar esses modelos é o CDR (Call Detail Record) que fornece informações sobre a origem e o destino das chamadas de voz no nível das torres de telecomunicações em uma rede móvel. A baixa resolução espacial e a esparsidade temporal desses dados constituem um desafio ao utilizá-los para a caracterização da mobilidade e é um tópico atual de pesquisa para a comunidade de Ciência da Computação.Ao longo deste trabalho, estudámos e comparámos diferentes fontes de dados para a caracterização da mobilidade (incluindo CDRs). Avaliámos o impacto que a variação de quatro parâmetros de qualidade dos conjuntos de dados CDR têem na detecção de padrões de deslocação pendular: (1) densidade das torres de telecomunicações por quilómetro quadrado; (2) número médio de chamadas feitas ou recebidas por dia por utilizador; (3) regularidade nessa atividade celular; (4) número de dias de atividade cellular por parte do utilizador. Concluímos que podemos inferir os padrões de 10,42% dos utilizadores num conjunto de dados CDR considerando utilizadores com um máximo de 7,5 chamadas por dia. Considerar utilizadores com maior atividade em termos de frequência de chamadas (mais de 7,5 chamadas por dia, em média) não resulta em uma melhoria significativa nos resultados. Incluindo na nossa amostra de dados utilizadores com uma regularidade de atividade de 16,8 dias ou mais, faz com que possamos aproveitar apenas um máximo de 0,27% deles para inferir rotas casa-trabalho ou vice-versa. Por outro lado, se tivermos utilizadores com uma regularidade menor que 16,8 dias na nossa amostra, poderemos observar um crescimento significativamente maior (que pode chegar a 11,1%) na percentagem de utilizadores a partir dos quais podemos inferir rotas casa-trabalho ou vice-versa. Também descobrímos que, quanto maior o número de dias de atividade celular dos utilizadores no conjunto de dados, maior a percentagem deles a partir da quais podemos inferir padrões de deslocação pendular (quase linear).Também propusemos uma abordagem otimizada para inferir padrões de deslocação pendular, incluindo viagens de origem/destino e os respectivos modos de transporte unimodais/multimodais (carro, autocarro, comboio, elétrico, metro, a pé e bicicleta). Apresentamos resultados e conclusões obtidos a partir de dados de 5000 utilizadores, ao longo de catorze meses de comunicações, nos 18 distritos portugueses. Fizémos uma análise mais aprofundada do perfil de mobilidade e caracterização de três cidades portuguesas - Lisboa, Porto e Coimbra. As duas primeiras cidades são as maiores, e teem várias opções de transporte, a terceira é uma cidade de tamanho médio, onde o carro particular é o principal modo de transporte. As estimativas obtidas da composição da escolha do modo de transporte (valor percentual por cada modo de transporte) foram validadas com censos portugueses que foram utilizados como dados verdadeiros. A nossa metodologia atingiu então uma precisão de 67%.
Cities are becoming more and more a magnet for diversity, creativity, and wellbeing. Challenges related to increased density and complexity are being addressed by the integration of smarter computational systems at the various levels of the urban fabric. Data plays a crucial role in understanding urban flows and mobility patterns through the development of models that are used to improve the transportation network, social environment, and security in urban spaces. A type of data used to feed these models is the Call Detail Records (CDRs) that provide information on the origin and destination of voice calls at the level of the base stations in a cellular network. The low spatial resolution and temporal sparsity of these data constitute challenges in using them for mobility characterization and is a current topic of research for the Computer Science community. Throughout this work, we study and compare different data sources for mobility characterization (including CDRs). We assess the impact that the variance of four quality parameters of CDR datasets have on the detection of commuting patterns: (1) density of the base stations per square kilometer; (2) average number of calls made or received per day per user; (3) regularity of these calls; (4) number of active days per user. We concluded that we can infer the commuting patterns of 10.42% of the users in a CDR dataset by considering users with a maximum of 7.5 calls per day. Considering users with higher activity in terms of frequency of calls (more than 7.5 calls per day on average) does not result in a significant improvement in the results. Including in our dataset users with a regularity of 16.8 days or more, we can only avail a maximum of 0.27% of them to infer routes home to the workplace or vice-versa. Conversely, if we have users with a regularity less than 16.8 in our dataset, we can notice a significantly higher growth (that can go up to 11.1%) in the percentage of users from which we can infer routes home to workplace or vice versa. We also found that the higher the number of days of call activity of the users in our dataset, the bigger the percentage of them from which we can infer commuting patterns (almost linear).We also proposed an optimized approach to infer commuting patterns, including origin/destination trips and the respective unimodal/multimodal modes (car, bus, train, tram, subway, walking, and bicycle). We present results and conclusions obtained from data on 5000 users, along fourteen months of communication, across the 18 Portuguese districts. We did a more in-depth analysis of the mobility profile and characterization of three Portuguese cities – Lisbon, Porto, and Coimbra. The two first cities are the larger ones with various travel mode options, and the third one is a medium-size city where the private car is the first mode of transport. Obtained estimations of the mode choice composition (percentages per mode of transport) were validated with Portuguese censuses that were used as ground truth. Then, our methodology reached an accuracy of 67%.
Description: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/87976
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat
Joel_Pires_tese.pdf5.49 MBAdobe PDFView/Open
Show full item record

Page view(s)

190
checked on Apr 23, 2024

Download(s)

158
checked on Apr 23, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons