Prospecção de conceitos geográficos na web

Detalhes bibliográficos
Autor(a) principal: Batista, David Soares
Data de Publicação: 2009
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/4510
Resumo: Tese de mestrado, Engenharia Informática (Arquitectura, Sistemas e Redes de Computadores), Universidade de Lisboa, Faculdade de Ciências, 2009
id RCAP_e5ba5973a5dfb12f94e38263b4b6d1b6
oai_identifier_str oai:repositorio.ul.pt:10451/4510
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Prospecção de conceitos geográficos na webExtracção de informação geográficaConditional random fieldsOntologias geográficasWeb semânticaTeses de mestrado - 2009Tese de mestrado, Engenharia Informática (Arquitectura, Sistemas e Redes de Computadores), Universidade de Lisboa, Faculdade de Ciências, 2009Esta dissertacção apresenta um estudo feito sobre extracção de informacão de documentos, para geração de resumos geográficos. É estudado um método de aprendizagem supervisionada, com base em Conditional Random Fields para extracção de entidades em sequências de texto. O método estudado é integrado num sistema desenvolvido no âmbito desta dissertação, o HENDRIX, de forma a poder efectuar a extracção de entidades geográficas para textos em português e o seu tratamento. O tratamento das entidades geográficas extraídas é feito recorrendo a ontologias geográficas. O sistema desenvolvido foi depois usado para fazer a extracção de entidades geográficas de uma colecção de documentos, que representa uma recolha da web portuguesa, sob um cluster de computadores. São apresentados os resultados do desempenho do modelo gerado para extracção de informação geográfica e a análise das entidades geográficas extraídas da recolha da web portuguesa. A partir dos resultados observou-se que o corpus usado para treinar o modelo não é suficientemente expressivo para treinar um modelo de extracção de informação geográfica.This dissertation presents a research done on information extraction for the generation of geographic summaries. The method studied is based on Conditional Random Fields, a supervised learning method for labeling or parsing of sequential data, such as natural language text. This method is then integrated in a system developed during the course of this dissertation. The developed system, HENDRIX, performs geographic entities extraction for documents written in Portuguese. HENDRIX also generates a geographic summary based on the extracted entities and their relations on geographic ontologies. The developed system was then applied to a crawl of the Portuguese Web, using a cluster of computers. This dissertation presents the results of the performance of the generated model for geographic information extraction as well as an analysis of the extracted entities from the crawl. The results show that the corpus on which the generated model was based is not rich enough to generate a good model for geographic information extraction.Silva, Mário J. Gaspar da, 1961-Repositório da Universidade de LisboaBatista, David Soares2011-11-18T16:50:17Z20092009-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/4510porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T15:45:32Zoai:repositorio.ul.pt:10451/4510Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:30:08.019108Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Prospecção de conceitos geográficos na web
title Prospecção de conceitos geográficos na web
spellingShingle Prospecção de conceitos geográficos na web
Batista, David Soares
Extracção de informação geográfica
Conditional random fields
Ontologias geográficas
Web semântica
Teses de mestrado - 2009
title_short Prospecção de conceitos geográficos na web
title_full Prospecção de conceitos geográficos na web
title_fullStr Prospecção de conceitos geográficos na web
title_full_unstemmed Prospecção de conceitos geográficos na web
title_sort Prospecção de conceitos geográficos na web
author Batista, David Soares
author_facet Batista, David Soares
author_role author
dc.contributor.none.fl_str_mv Silva, Mário J. Gaspar da, 1961-
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Batista, David Soares
dc.subject.por.fl_str_mv Extracção de informação geográfica
Conditional random fields
Ontologias geográficas
Web semântica
Teses de mestrado - 2009
topic Extracção de informação geográfica
Conditional random fields
Ontologias geográficas
Web semântica
Teses de mestrado - 2009
description Tese de mestrado, Engenharia Informática (Arquitectura, Sistemas e Redes de Computadores), Universidade de Lisboa, Faculdade de Ciências, 2009
publishDate 2009
dc.date.none.fl_str_mv 2009
2009-01-01T00:00:00Z
2011-11-18T16:50:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/4510
url http://hdl.handle.net/10451/4510
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134188140494848