Please use this identifier to cite or link to this item: http://hdl.handle.net/10316/95555
Title: WhereToGo :Identification and classification of places of interest using anonymized mobile communication data
Other Titles: WhereToGo : Identificação dos Locais de Interesse usando Dados Anónimos de Comunicações Móveis
Authors: Ferreira, Gonçalo Francisco
Orientador: Bento, Carlos Manuel Robalo Lisboa
Keywords: Algoritmos de Clustering; Call Detail Records; Dados de comunicações móveis; Locais importantes; Mobilidade Humana; Call Detail Records; Clustering Algorithms; Human Mobility; Meaningful places; Mobile Phone Data
Issue Date: 13-Jul-2021
Serial title, monograph or event: WhereToGo :Identification and classification of places of interest using anonymized mobile communication data
Place of publication or event: DEI- FCTUC
Abstract: A obtenção de conhecimento sobre a mobilidade humana tem uma importância transversal a diversos campos científicos e aplicações práticas, deste redes ad-hoc a cidades inteligentes, de sistemas de recomendação em redes sociais a soluções de planeamento de transportes. Registos de localização digitais permitem extrair o conhecimento de como as pessoas experienciam as cidades e o espaço em geral. Estas ‘pegadas’ de localização servem assim como base para detetar padrões de mobilidade, muitas vezes com o objetivo final de criar produtos e serviços personalizados. Recentemente Call Detail Records(CDRs) demonstraram ter um grande potencial para pesquisas relacionadas com a análise de padrões de movimento individuais e identificação de locais importantes. Este tipo de dados oferece vantagens sobre as alternativas, uma vez que é ubíquo, computacionalmente menos exigente de avaliar e mais fácil de recolher em grande escala do que, por exemplo, GPS traces. Contudo, trabalhos anteriores que recorrem a CDRs tendem a focar-se em modelar apenas os padrões espaciais e temporais da mobilidade, não dando atenção à semântica dos locais, ignorando assim a procura pelas motivações por detrás da mobilidade. Embora a questão de inferir atividades realizadas esteja mais estabilizada com tipos de informação mais detalhados como o GPS, ainda existe muito espaço para melhorias e inovações utilizando CDRs.Nesta tese pretendemos criar um sistema capaz de identificar locais de rotina de utilizadores e adicionar-lhes um significado semântico, procurando assim inferir as motivações para a mobilidade do dia-a-dia. Para chegar ao objetivo final começamos por investigar e aplicar métodos para preparar os dados, incluindo a remoção de registos anómalos, mitigando problemas conhecidos associados aos CDRs. De seguida, encontramos padrões espaciais e temporais nos registos utilizando dois algoritmos de clustering, o DBSCAN, para os locais de casa e trabalho, assim como o K-means, para as restantes localizações de rotina. Finalmente classificamos os locais de rotina encontrados de acordo com a atividade mais provável, para tal recorrendo a Pontos de Interesse na vizinhança.Este trabalho também propõe um novo método para posicionar a localização de um utilizador nos CDRs com recurso a conhecimentos sobre a direção e alcance do sinal de antenas de telecomunicações. Adicionalmente foram aplicados métodos para validar alguns dos resultados obtidos no decorrer do projeto, usando dados ground-truth recolhidos de cerca de 4600 utilizadores.
The importance of understanding human mobility is transversal to multiple fields of study and practical applications, from ad-hoc networks to smart cities, from recommendation systems on social networks to transportation planning. Digital location traces can help extract insights about how citizens experience their cities. Moreover, these footprints serve as the foundation to detect patterns and offer personalized products and experiences to people.In recent years Call Detail Records (CDRs) have shown great potential for research purposes on the analysis of movement patterns and identification of important places. This data type offers significant advantages over alternatives as it is ubiquitous, computationally inexpensive and easier to collect in large-scale. However, previous works using CDRs tend to focus on modeling spatial and temporal patterns of human mobility, not paying much attention to the semantics of places, thus failing to model people’s motivation behind their mobility. Although the question of identifying user's activities is far more stabilised with detailed information types, such as GPS, we feel that there is still room for improvement and innovation working with CDRs.In this work, we aim to create a system that can identify individual users routine places and attach some semantic meaning to them, inferring the motivations for day-to-day mobility. We investigate and apply methods to prepare the data, mitigating known flaws of CDRs, including the removal of anomalous records. We then find the spatio-temporal patterns of user’s records using two clustering algorithm, the density-based DBSCAN, for home and workplace, and the partition based K-means clustering for other routine places. Finally we classify the discovered places according to most likely activity, using nearby Points of Interest.This research also introduces a novel methodology to position user's localization from CDRs through improved understanding of antenna's signal areas. Moreover, several methods were developed and applied to validate some of the generated results using ground-truth data obtained from 4600 users.
Description: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
URI: http://hdl.handle.net/10316/95555
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat
Gonçalo Francisco Ferreira.pdf8.23 MBAdobe PDFView/Open
Show full item record

Page view(s)

18
checked on Sep 24, 2021

Download(s)

22
checked on Sep 24, 2021

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons