Extracção de Informação Semântica de Conteúdo da Web 2.0

Carvalheira, Ana Rita Bento

Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/35585

Título:	Extracção de Informação Semântica de Conteúdo da Web 2.0
Autor:	Carvalheira, Ana Rita Bento
Orientador:	Gomes, Paulo Jorge de Sousa
Palavras-chave:	Língua Portuguesa; Media Social; Pesquisa Semântica; Processamento de Linguagem Natural; Web 2 0; Web Semântica; Web Social
Data:	8-Jul-2014
Título da revista, periódico, livro ou evento:	Extracção de Informação Semântica de Conteúdo da Web 2.0
Local de edição ou do evento:	Coimbra
Resumo:	A massiva proliferação de blogues e redes sociais fez com que o conteúdo gerado pelos utilizadores, presente em plataformas como o Twitter ou Facebook, se tornasse bastante valioso pela quantidade de informação passível de ser extraída e explorada. No entanto, a análise de informação proveniente destas fontes apresenta bastantes desafios, devido, não só, ao curto tamanho das mensagens, mas também ao tipo de linguagem usada, que contém inúmeras abreviaturas, erros ortográficos e conteúdo específico da media social, o que dificulta significativamente a tarefa de extração de informação a partir deste texto. A presente tese visa o desenvolvimento de um conjunto de ferramentas que permitem efetuar a análise e extração de conhecimento a partir de várias fontes da Web 2.0, recorrendo ao uso de diversas técnicas de Processamento de Linguagem Natural e representando esse conhecimento através de tecnologias da Web Semântica. De forma a realizar este objetivo foi desenvolvida uma biblioteca, constituída por vários módulos que possibilitam a extração de informação semântica a partir de notícias online, blogues e publicações provenientes de redes sociais. Foi também desenvolvido um sistema cujo principal objetivo é demonstrar as funcionalidades providenciadas pela biblioteca, permitindo a realização de pesquisa e navegação sobre a informação extraída e representando-a através de tecnologias da Web Semântica. Importa ainda salientar que a biblioteca suporta unicamente a língua portuguesa (português de Portugal) o que, por si só, representa um desafio, visto existirem relativamente poucos recursos disponíveis para o português.
Descrição:	Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra
URI:	https://hdl.handle.net/10316/35585
Direitos:	openAccess
Aparece nas coleções:	UC - Dissertações de Mestrado FCTUC Eng.Informática - Teses de Mestrado

Ficheiros deste registo:

Ficheiro	Descrição	Tamanho	Formato
Extracao de Informacao Semantica de Conteudo da Web 2.0.pdf		6.24 MB	Adobe PDF	Ver/Abrir

Mostrar registo em formato completo

Visualizações de página 20

755

Visto em 23/abr/2024

Downloads 50

523

Visto em 23/abr/2024

Google Scholar^TM

Verificar

Ficheiros deste registo:

Visualizações de página 20

Downloads 50

Google ScholarTM

Google Scholar^TM