Extracção de Informação Semântica de Conteúdo da Web 2.0
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/35585 |
Resumo: | Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra |
id |
RCAP_7c57f0ca75ce2aac19878503338aa79b |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/35585 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Extracção de Informação Semântica de Conteúdo da Web 2.0Língua PortuguesaMedia SocialPesquisa SemânticaProcessamento de Linguagem NaturalWeb 2 0Web SemânticaWeb SocialDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de CoimbraA massiva proliferação de blogues e redes sociais fez com que o conteúdo gerado pelos utilizadores, presente em plataformas como o Twitter ou Facebook, se tornasse bastante valioso pela quantidade de informação passível de ser extraída e explorada. No entanto, a análise de informação proveniente destas fontes apresenta bastantes desafios, devido, não só, ao curto tamanho das mensagens, mas também ao tipo de linguagem usada, que contém inúmeras abreviaturas, erros ortográficos e conteúdo específico da media social, o que dificulta significativamente a tarefa de extração de informação a partir deste texto. A presente tese visa o desenvolvimento de um conjunto de ferramentas que permitem efetuar a análise e extração de conhecimento a partir de várias fontes da Web 2.0, recorrendo ao uso de diversas técnicas de Processamento de Linguagem Natural e representando esse conhecimento através de tecnologias da Web Semântica. De forma a realizar este objetivo foi desenvolvida uma biblioteca, constituída por vários módulos que possibilitam a extração de informação semântica a partir de notícias online, blogues e publicações provenientes de redes sociais. Foi também desenvolvido um sistema cujo principal objetivo é demonstrar as funcionalidades providenciadas pela biblioteca, permitindo a realização de pesquisa e navegação sobre a informação extraída e representando-a através de tecnologias da Web Semântica. Importa ainda salientar que a biblioteca suporta unicamente a língua portuguesa (português de Portugal) o que, por si só, representa um desafio, visto existirem relativamente poucos recursos disponíveis para o português.2014-07-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/35585http://hdl.handle.net/10316/35585TID:201537451porCarvalheira, Ana Rita Bentoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T04:34:02Zoai:estudogeral.uc.pt:10316/35585Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:54:29.087133Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Extracção de Informação Semântica de Conteúdo da Web 2.0 |
title |
Extracção de Informação Semântica de Conteúdo da Web 2.0 |
spellingShingle |
Extracção de Informação Semântica de Conteúdo da Web 2.0 Carvalheira, Ana Rita Bento Língua Portuguesa Media Social Pesquisa Semântica Processamento de Linguagem Natural Web 2 0 Web Semântica Web Social |
title_short |
Extracção de Informação Semântica de Conteúdo da Web 2.0 |
title_full |
Extracção de Informação Semântica de Conteúdo da Web 2.0 |
title_fullStr |
Extracção de Informação Semântica de Conteúdo da Web 2.0 |
title_full_unstemmed |
Extracção de Informação Semântica de Conteúdo da Web 2.0 |
title_sort |
Extracção de Informação Semântica de Conteúdo da Web 2.0 |
author |
Carvalheira, Ana Rita Bento |
author_facet |
Carvalheira, Ana Rita Bento |
author_role |
author |
dc.contributor.author.fl_str_mv |
Carvalheira, Ana Rita Bento |
dc.subject.por.fl_str_mv |
Língua Portuguesa Media Social Pesquisa Semântica Processamento de Linguagem Natural Web 2 0 Web Semântica Web Social |
topic |
Língua Portuguesa Media Social Pesquisa Semântica Processamento de Linguagem Natural Web 2 0 Web Semântica Web Social |
description |
Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014-07-08 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/35585 http://hdl.handle.net/10316/35585 TID:201537451 |
url |
http://hdl.handle.net/10316/35585 |
identifier_str_mv |
TID:201537451 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133831657160704 |