Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/99713
Title: Projeto EDUCA
Authors: Borges, Nuno Ricardo Rodrigues
Orientador: Gomes, Paulo J. S.
Keywords: Classificação automática de documentos; Plataforma Web; Reconhecimento de entidades mencionadas; Repositório de conteúdos digitais; Sumarização automática de documentos
Issue Date: 2-Jul-2013
Place of publication or event: Coimbra
Abstract: O projeto EDUCA é uma plataforma informática para suportar um repositório de conteúdos multimédia para pesquisa, agregação e proteção dos conteúdos. Nesta plataforma é pretendido que seja feita a extração automática de informação, classificação e sumarização automática de documentos de texto. A extração automática de informação corresponde a obter a informações contidas no ficheiro, como titulo, data de criação, autores, entre outros. A informação aqui descrita corresponde aos metadados. No entanto, no caso de documentos de texto a informação extraído contempla também o próprio texto. A classificação automática de documentos de texto assenta na classificação dos documentos em várias categorias, permitindo depois ao utilizador pesquisar os documentos por categoria. No caso da sumarização automática de texto tem como objetivo criar um resumo do documento. A existência de um resumo sobre um qualquer documento indica ao utilizador sobre o que é que o documento retrata. A abordagem que é pretendida seguir na classificação automática de documentos é semi-supervisionada, tendo como expectativa tirar partido de análises anteriores, para melhorar as análises posteriores. No caso da sumarização de documentos a abordagem será superficial, ou seja, uma com base estatística. O presente relatório pretende mostrar todo o trabalho desenvolvido pelo estagiário ao longo do estágio, para resolver os problemas de classificação e sumarização automática de documentos de texto.
Description: Dissertação e Relatório Final Estágio do Mestrado Engenharia Informática apresentado à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
URI: https://hdl.handle.net/10316/99713
Rights: openAccess
Appears in Collections:FCTUC Eng.Informática - Teses de Mestrado

Files in This Item:
File Description SizeFormat
Nuno_Ricardo_Rodrigues_Borges_2007183992_Projeto_EDUCA.pdf2.35 MBAdobe PDFView/Open
Show full item record

Page view(s)

53
checked on Apr 16, 2024

Download(s)

11
checked on Apr 16, 2024

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.