Uso de uma ontologia de lugar urbano para reconhecimento e extração de evidências geoespaciais na Web

Detalhes bibliográficos
Autor(a) principal: Karla Albuquerque de Vasconcelos Borges
Data de Publicação: 2006
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/SLBS-6XYFYS
Resumo: Consultas que incluem pelo menos um termo relacionado a geografia, como nomes de lugar e feições naturais, são hoje um subconjunto significativo das consultas submetidas às máquinas de busca. O interesse por informação local na Web (busca local) vem aumentando a cada dia e para esse tipo de busca, a Web é um vasto repositório de informação local e geográfica. No entanto, as máquinas de busca tradicionais apresentam limitações quanto ao reconhecimento do escopo geográfico existente nas páginas da Web. Páginas referentes ao mesmo lugar, mas que usam nomes alternativos provavelmente não serão recuperadas juntas. Além disso, muitas vezes o contexto geográfico existente nas páginas está implícito, podendo ser inferido pela existência, por exemplo, de um número de telefone ou código postal. Para resolver esses problemas, esta tese tem como foco a Web local, propondo uma abordagem apoiada em uma ontologia de lugar urbano, que permita reconhecer, extrair e geocodificar evidências geo-espaciais de características locais, como endereços, códigos postais e telefones presentes em páginas da Web. As evidências geo-espaciais representam localizações implícitas, capazes de correlacionar o conteúdo de uma página, ou de parte dela, a uma localização geográfica urbana. Assim, as máquinas de busca poderiam por exemplo, utilizar essa informação para a recuperação de páginas referentes a serviços e atividades em uma determinada localidade ou próximos a ela. Assim as principais contribuições desta tese são (1) caracterização de endereços presentes em páginas da Web como fontes de evidência geo-espacial e definição de padrões para o seu reconhecimento e extração, (2) definição da OnLocus, uma ontologia de lugar urbano para auxiliar o processo de reconhecimento e extração de evidências geo-espaciais de páginas da Web, (3) criação de uma base de conhecimento para reconhecimento de lugares brasileiros, baseada na OnLocus, (4) proposta de uma estratégia de categorização geográfica de uma página,ou de partes dela, dentro da divisão territorial de um país, e (5) avaliação das características quantitativas e qualitativas dos endereços presentes nas páginas da Web brasileira. Todas essas contribuições foram validadas por meio de experimentação, usando dados reais correspondentes a um conjunto de 4 milhões de páginas da Web. Como conseqüência adicional, foi possível traçar um retrato das páginas da Web brasileira no que tange a padrões de endereço e, conseqüentemente, entender melhor como geocodificá-las. Os resultados desta tese abrem um leque de perspectivas para novos tipos de aplicação, como, por exemplo, uso de links de navegação baseados em localização geográfica, classificação geográfica das páginas da Web, mineração de dados geo-espaciais em páginas da Web e anotação semântica das páginas.
id UFMG_8853b691e02295a8ee4d1077a4be9ff2
oai_identifier_str oai:repositorio.ufmg.br:1843/SLBS-6XYFYS
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Alberto Henrique Frade LaenderCláudia Maria Bauzer MedeirosAltigran Soares da SilvaGilberto Câmara NetoMarco Antonio CasanovaMarcos Andre GoncalvesKarla Albuquerque de Vasconcelos Borges2019-08-12T06:51:36Z2019-08-12T06:51:36Z2006-08-31http://hdl.handle.net/1843/SLBS-6XYFYSConsultas que incluem pelo menos um termo relacionado a geografia, como nomes de lugar e feições naturais, são hoje um subconjunto significativo das consultas submetidas às máquinas de busca. O interesse por informação local na Web (busca local) vem aumentando a cada dia e para esse tipo de busca, a Web é um vasto repositório de informação local e geográfica. No entanto, as máquinas de busca tradicionais apresentam limitações quanto ao reconhecimento do escopo geográfico existente nas páginas da Web. Páginas referentes ao mesmo lugar, mas que usam nomes alternativos provavelmente não serão recuperadas juntas. Além disso, muitas vezes o contexto geográfico existente nas páginas está implícito, podendo ser inferido pela existência, por exemplo, de um número de telefone ou código postal. Para resolver esses problemas, esta tese tem como foco a Web local, propondo uma abordagem apoiada em uma ontologia de lugar urbano, que permita reconhecer, extrair e geocodificar evidências geo-espaciais de características locais, como endereços, códigos postais e telefones presentes em páginas da Web. As evidências geo-espaciais representam localizações implícitas, capazes de correlacionar o conteúdo de uma página, ou de parte dela, a uma localização geográfica urbana. Assim, as máquinas de busca poderiam por exemplo, utilizar essa informação para a recuperação de páginas referentes a serviços e atividades em uma determinada localidade ou próximos a ela. Assim as principais contribuições desta tese são (1) caracterização de endereços presentes em páginas da Web como fontes de evidência geo-espacial e definição de padrões para o seu reconhecimento e extração, (2) definição da OnLocus, uma ontologia de lugar urbano para auxiliar o processo de reconhecimento e extração de evidências geo-espaciais de páginas da Web, (3) criação de uma base de conhecimento para reconhecimento de lugares brasileiros, baseada na OnLocus, (4) proposta de uma estratégia de categorização geográfica de uma página,ou de partes dela, dentro da divisão territorial de um país, e (5) avaliação das características quantitativas e qualitativas dos endereços presentes nas páginas da Web brasileira. Todas essas contribuições foram validadas por meio de experimentação, usando dados reais correspondentes a um conjunto de 4 milhões de páginas da Web. Como conseqüência adicional, foi possível traçar um retrato das páginas da Web brasileira no que tange a padrões de endereço e, conseqüentemente, entender melhor como geocodificá-las. Os resultados desta tese abrem um leque de perspectivas para novos tipos de aplicação, como, por exemplo, uso de links de navegação baseados em localização geográfica, classificação geográfica das páginas da Web, mineração de dados geo-espaciais em páginas da Web e anotação semântica das páginas.Queries that include at least one geographic-related term, such as place names and natural features, are currently a significant subset of the queries that are submitted to search engines. Interest on local information on the Web (local search) is increasing daily, and for this kind of search, the Web is a vast repository of local geographic information. However, traditional search engines have limitation on the recognition of the geographic scope of Web pages. Pages that refer to the same place, but using alternative names, probably will not be retrieved together. Besides, in many situations the geographic context is implicit in the pages, but can be inferred by the existence, for instance, of a telephone number or postal code. In order to propose a solution for these problems, this thesis focuses on the local Web, presenting an approach based on an ontology of urban place, which allows for the recognition, extraction, and geocoding of geospatial evidences with local characteristics, such as urban addresses, postal codes, and telephone numbers as found in Web pages. The geospatial evidences are implicitly related to places, so that the contents of a page, or parts of it, can be correlated to an urban geographic location. Thus, search engines can, for instance, use such information to retrieve pages that are related to services and activities in a certain location or close to it. Therefore, the main contributions of this thesis are (1) the characterization of urban addresses contained in Web pages as sources of geospatial evidences and definition of patterns for their recognition and extraction, (2) the definition of OnLocus, an ontology of urban place that helps in the process recognizing and extracting geospatial evidences from Web pages, (3) the creation of a database for recognition of Brazilian places, based on OnLocus, (4) the proposal of a strategy for geographic categorization of a Web page, or parts of it, within a country's territorial divisions, and (5) the evaluation of the quantitative and qualitative characteristics of urban addresses that are found in the pages of the Brazilian Web. All of these contributions have been validated through experimentation, using real data from a set of 4 million Web pages. As an additional result, it was possible to obtain a snapshot of the usage of addresses in pages from the Brazilian Web and, consequently, to better understand how to geocode them. Results of this thesis open a range of perspectives for new types of applications, such as, for instance, the use of navigational links based on geographic location, geographic classification of Web pages, Web-based geospatial data mining, and semantic annotation of pages.Universidade Federal de Minas GeraisUFMGOntologiasComputaçãoSistemas de informação geograficaSistemas de recuperação da informaçãoOntologiaSistema de informacao geograficasWebUso de uma ontologia de lugar urbano para reconhecimento e extração de evidências geoespaciais na Webinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALtesekarlaborges.pdfapplication/pdf3499839https://repositorio.ufmg.br/bitstream/1843/SLBS-6XYFYS/1/tesekarlaborges.pdf4781654bf0c20a16c3a6470fa11d904cMD51TEXTtesekarlaborges.pdf.txttesekarlaborges.pdf.txtExtracted texttext/plain388255https://repositorio.ufmg.br/bitstream/1843/SLBS-6XYFYS/2/tesekarlaborges.pdf.txt5f89b13c50d1d31943ea4473c47f9e54MD521843/SLBS-6XYFYS2019-11-14 10:14:28.153oai:repositorio.ufmg.br:1843/SLBS-6XYFYSRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T13:14:28Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Uso de uma ontologia de lugar urbano para reconhecimento e extração de evidências geoespaciais na Web
title Uso de uma ontologia de lugar urbano para reconhecimento e extração de evidências geoespaciais na Web
spellingShingle Uso de uma ontologia de lugar urbano para reconhecimento e extração de evidências geoespaciais na Web
Karla Albuquerque de Vasconcelos Borges
Ontologia
Sistema de informacao geograficas
Web
Ontologias
Computação
Sistemas de informação geografica
Sistemas de recuperação da informação
title_short Uso de uma ontologia de lugar urbano para reconhecimento e extração de evidências geoespaciais na Web
title_full Uso de uma ontologia de lugar urbano para reconhecimento e extração de evidências geoespaciais na Web
title_fullStr Uso de uma ontologia de lugar urbano para reconhecimento e extração de evidências geoespaciais na Web
title_full_unstemmed Uso de uma ontologia de lugar urbano para reconhecimento e extração de evidências geoespaciais na Web
title_sort Uso de uma ontologia de lugar urbano para reconhecimento e extração de evidências geoespaciais na Web
author Karla Albuquerque de Vasconcelos Borges
author_facet Karla Albuquerque de Vasconcelos Borges
author_role author
dc.contributor.advisor1.fl_str_mv Alberto Henrique Frade Laender
dc.contributor.advisor-co1.fl_str_mv Cláudia Maria Bauzer Medeiros
dc.contributor.referee1.fl_str_mv Altigran Soares da Silva
dc.contributor.referee2.fl_str_mv Gilberto Câmara Neto
dc.contributor.referee3.fl_str_mv Marco Antonio Casanova
dc.contributor.referee4.fl_str_mv Marcos Andre Goncalves
dc.contributor.author.fl_str_mv Karla Albuquerque de Vasconcelos Borges
contributor_str_mv Alberto Henrique Frade Laender
Cláudia Maria Bauzer Medeiros
Altigran Soares da Silva
Gilberto Câmara Neto
Marco Antonio Casanova
Marcos Andre Goncalves
dc.subject.por.fl_str_mv Ontologia
Sistema de informacao geograficas
Web
topic Ontologia
Sistema de informacao geograficas
Web
Ontologias
Computação
Sistemas de informação geografica
Sistemas de recuperação da informação
dc.subject.other.pt_BR.fl_str_mv Ontologias
Computação
Sistemas de informação geografica
Sistemas de recuperação da informação
description Consultas que incluem pelo menos um termo relacionado a geografia, como nomes de lugar e feições naturais, são hoje um subconjunto significativo das consultas submetidas às máquinas de busca. O interesse por informação local na Web (busca local) vem aumentando a cada dia e para esse tipo de busca, a Web é um vasto repositório de informação local e geográfica. No entanto, as máquinas de busca tradicionais apresentam limitações quanto ao reconhecimento do escopo geográfico existente nas páginas da Web. Páginas referentes ao mesmo lugar, mas que usam nomes alternativos provavelmente não serão recuperadas juntas. Além disso, muitas vezes o contexto geográfico existente nas páginas está implícito, podendo ser inferido pela existência, por exemplo, de um número de telefone ou código postal. Para resolver esses problemas, esta tese tem como foco a Web local, propondo uma abordagem apoiada em uma ontologia de lugar urbano, que permita reconhecer, extrair e geocodificar evidências geo-espaciais de características locais, como endereços, códigos postais e telefones presentes em páginas da Web. As evidências geo-espaciais representam localizações implícitas, capazes de correlacionar o conteúdo de uma página, ou de parte dela, a uma localização geográfica urbana. Assim, as máquinas de busca poderiam por exemplo, utilizar essa informação para a recuperação de páginas referentes a serviços e atividades em uma determinada localidade ou próximos a ela. Assim as principais contribuições desta tese são (1) caracterização de endereços presentes em páginas da Web como fontes de evidência geo-espacial e definição de padrões para o seu reconhecimento e extração, (2) definição da OnLocus, uma ontologia de lugar urbano para auxiliar o processo de reconhecimento e extração de evidências geo-espaciais de páginas da Web, (3) criação de uma base de conhecimento para reconhecimento de lugares brasileiros, baseada na OnLocus, (4) proposta de uma estratégia de categorização geográfica de uma página,ou de partes dela, dentro da divisão territorial de um país, e (5) avaliação das características quantitativas e qualitativas dos endereços presentes nas páginas da Web brasileira. Todas essas contribuições foram validadas por meio de experimentação, usando dados reais correspondentes a um conjunto de 4 milhões de páginas da Web. Como conseqüência adicional, foi possível traçar um retrato das páginas da Web brasileira no que tange a padrões de endereço e, conseqüentemente, entender melhor como geocodificá-las. Os resultados desta tese abrem um leque de perspectivas para novos tipos de aplicação, como, por exemplo, uso de links de navegação baseados em localização geográfica, classificação geográfica das páginas da Web, mineração de dados geo-espaciais em páginas da Web e anotação semântica das páginas.
publishDate 2006
dc.date.issued.fl_str_mv 2006-08-31
dc.date.accessioned.fl_str_mv 2019-08-12T06:51:36Z
dc.date.available.fl_str_mv 2019-08-12T06:51:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/SLBS-6XYFYS
url http://hdl.handle.net/1843/SLBS-6XYFYS
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/SLBS-6XYFYS/1/tesekarlaborges.pdf
https://repositorio.ufmg.br/bitstream/1843/SLBS-6XYFYS/2/tesekarlaborges.pdf.txt
bitstream.checksum.fl_str_mv 4781654bf0c20a16c3a6470fa11d904c
5f89b13c50d1d31943ea4473c47f9e54
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589157094686720