Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/110783
Title: Natural Language Processing In Citizen Messages About Forest Fires
Other Titles: Processamento de Linguagem Natural em mensagens de cidadãos relativos a fogo
Authors: Conceição, Tiago Emanuel Pacheco Caldeira
Orientador: Silva, Catarina Helena Branco Simões da
Oliveira, Hugo Ricardo Gonçalo
Keywords: Eventos Catastroficos; Cidadania; Processamento de Linguagem Natural; Machine Learning; Transformers; Catastrophic Events; Citizenship; Natural Language Processing; Machine Learning; Transformers
Issue Date: 20-Sep-2023
Serial title, monograph or event: Natural Language Processing In Citizen Messages About Forest Fires
Place of publication or event: DEI-FCTUC
Abstract: Com o recente aumento de eventos catastróficos em todo o mundo, existe a necessidade de os monitorizar. Como resultado deste crescimento e tirando partido da tecnologia atualmente existente é necessário criar um sistema que receba dos cidadãos relatos destes acontecimentos. Se o texto, depois de passar por este sistema, surgir de forma estruturada e concreta, é possível obter mais informação e, posteriormente, comunicá-la às autoridades competentes para que estas possam utilizar esse conhecimento para atuar em conformidade.Neste sentido, existe um projeto denominado FireLoc, que visa agilizar o processo de comunicação entre os cidadãos e as autoridades, permitindo que a informação seja transmitida da melhor forma possível e mitigando falhas de localização e precisão. Este facto permite uma fonte de dados viável para a comunicação entre os cidadãos e as autoridades responsáveis.A abordagem adoptada para a realização desta tese passa pela recolha de texto dos cidadãos através das redes sociais que corresponde a uma contribuição que será considerada um relatório. Com as capacidades atuais de processamento de linguagem natural e após a captura do texto, este conteúdo será aproveitado para capturar informação extra, utilizando métodos bem conhecidos como a análise de sentimento, a classificação de eventos e o agrupamento de eventos. Através da análise de sentimentos, podemos tirar partido do texto para obter o sentimento, o que nos permite compreender a gravidade do evento com base na confiança. Outra forma de obter informação é através da classificação de eventos, que permite classificar o evento para ver se corresponde efetivamente a um evento, permitindo filtrar apenas os relatórios relevantes. O último método que também é utilizado na abordagem é o clustering de eventos, que permite agrupar os eventos de acordo com determinadas características, fornecendo informação extra sobre o sentimento de cada agrupamento de dados e também informação sobre a forma como os eventos estão relacionados geograficamente. Finalmente, para complementar toda a informação captada, é necessário aplicar um método de visualização avançado que permita recolher os dados num formato visual e facilitar a sua compreensão.A conclusão que se pode retirar da abordagem adoptada é que, de facto, é possível recolher muita informação através do texto, o que se pode revelar uma mais-valia. E uma vez que o texto trata de relatos de um acontecimento catastrófico, toda a informação é relevante para agir em conformidade. Desta forma, e dado que o desenvolvimento desta tese se insere no contexto do projeto FireLoc, que funciona como um canal de comunicação direto entre os cidadãos e as autoridades competentes, espera-se que seja uma mais-valia. Espera-se que esta tese contribua com valor para as autoridades competentes.
With the recent increase in catastrophic events around the world, there is a need to monitor them. As a result of this growth and taking advantage of the technology that currently exists it is necessary to create a system that receives from citizens reports of these events. If the text after passing through this system comes up in a structured and concrete way, more information can be obtained and subsequently communicated with the relevant authorities so that they can use this knowledge to act accordingly.As such, there is a project called FireLoc, which aims to streamline the communication process between citizens and the authorities, allowing information to be transmitted in the best possible way and mitigating localization and accuracy failures. This allows a viable data source for communication between citizens and the responsible authorities.The approach taken to carry out this thesis involves collecting text from citizens via social media that corresponds to a contribution that will be considered a report. With the current capabilities of natural language processing and after the text has been captured, this content will be leveraged to capture extra information, using well-known methods such as sentiment analysis, event classification, and clustering events. Through sentiment analysis we can take advantage of the text to obtain the sentiment, thus allowing us to understand the severity of the event based on confidence. Another way of obtaining information is through event classification, which allows you to classify the event to see if it actually corresponds to an event, allowing you to filter out only the relevant reports. The last method that is also used in the approach is clustering events, which allows events to be grouped according to certain characteristics, providing extra information on the sentiment of each grouping of data and also information on how the events are related geographically. Finally, in order to complement all the information captured, it is necessary to apply an advanced visualization method that allows data to be collected in a visual format and made easier to understand.The conclusion that can be drawn from the approach taken is that, in fact, a lot of information can be gathered through the text, which can prove to be an asset. And since the text is about reports of a catastrophic event, all the information is relevant in order to act accordingly. In this way, and given that the development of this thesis comes in the context of the FireLoc project, which acts as a direct communication channel between citizens and the competent authorities, it is hoped that it will contribute value.Is expected to contribute value to the competent authorities.
Description: Dissertação de Mestrado em Engenharia e Ciência de Dados apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/110783
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File SizeFormat
Master_Thesis_Tiago_Conceicao.pdf2.72 MBAdobe PDFView/Open
Show full item record

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons