Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/99713
Título: Projeto EDUCA
Autor: Borges, Nuno Ricardo Rodrigues
Orientador: Gomes, Paulo J. S.
Palavras-chave: Classificação automática de documentos; Plataforma Web; Reconhecimento de entidades mencionadas; Repositório de conteúdos digitais; Sumarização automática de documentos
Data: 2-Jul-2013
Local de edição ou do evento: Coimbra
Resumo: O projeto EDUCA é uma plataforma informática para suportar um repositório de conteúdos multimédia para pesquisa, agregação e proteção dos conteúdos. Nesta plataforma é pretendido que seja feita a extração automática de informação, classificação e sumarização automática de documentos de texto. A extração automática de informação corresponde a obter a informações contidas no ficheiro, como titulo, data de criação, autores, entre outros. A informação aqui descrita corresponde aos metadados. No entanto, no caso de documentos de texto a informação extraído contempla também o próprio texto. A classificação automática de documentos de texto assenta na classificação dos documentos em várias categorias, permitindo depois ao utilizador pesquisar os documentos por categoria. No caso da sumarização automática de texto tem como objetivo criar um resumo do documento. A existência de um resumo sobre um qualquer documento indica ao utilizador sobre o que é que o documento retrata. A abordagem que é pretendida seguir na classificação automática de documentos é semi-supervisionada, tendo como expectativa tirar partido de análises anteriores, para melhorar as análises posteriores. No caso da sumarização de documentos a abordagem será superficial, ou seja, uma com base estatística. O presente relatório pretende mostrar todo o trabalho desenvolvido pelo estagiário ao longo do estágio, para resolver os problemas de classificação e sumarização automática de documentos de texto.
Descrição: Dissertação e Relatório Final Estágio do Mestrado Engenharia Informática apresentado à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
URI: https://hdl.handle.net/10316/99713
Direitos: openAccess
Aparece nas coleções:FCTUC Eng.Informática - Teses de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato
Nuno_Ricardo_Rodrigues_Borges_2007183992_Projeto_EDUCA.pdf2.35 MBAdobe PDFVer/Abrir
Mostrar registo em formato completo

Visualizações de página

74
Visto em 8/out/2024

Downloads

38
Visto em 8/out/2024

Google ScholarTM

Verificar


Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.