Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2001 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/2178 |
Resumo: | Existe uma necessidade latente de pesquisar, filtrar e manipular informações disponíveis em diversos formatos irregulares, entre elas as informações distribuídas na WWW (World Wide Web). Esses tipos de dados são semi-estruturados, pois não possuem uma estrutura explícita e regular, o que dificulta sua manipulação. Este trabalho apresenta como proposta o projeto de uma ferramenta para realizar a extração semântica e semi-automática de dados semi-estruturados. O usuário especifica, através de uma interface visual, um exemplo da estrutura hierárquica do documento e de seu relacionamento com os conceitos da ontologia, gerando uma gramática descritiva da estrutura implícita do mesmo. A partir dessa gramática, a ferramenta realiza a extração dos próximos documentos de forma automática, reestruturando o resultado em um formato regular de dados, neste caso, XML (eXtensible Markup Language). Além da conceituação do método de extração, são apresentados os experimentos realizados com o protótipo da ferramenta, bem como, os resultados obtidos nestes experimentos. Para a construção desta ferramenta, são analisadas características de outros métodos que constituem o estado da arte em extração de dados semi-estruturados. |
id |
URGS_11648ac19062180268942d5bbcd60be4 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/2178 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Silveira, Iraci Cristina daHeuser, Carlos Alberto2007-06-06T17:20:39Z2001http://hdl.handle.net/10183/2178000315470Existe uma necessidade latente de pesquisar, filtrar e manipular informações disponíveis em diversos formatos irregulares, entre elas as informações distribuídas na WWW (World Wide Web). Esses tipos de dados são semi-estruturados, pois não possuem uma estrutura explícita e regular, o que dificulta sua manipulação. Este trabalho apresenta como proposta o projeto de uma ferramenta para realizar a extração semântica e semi-automática de dados semi-estruturados. O usuário especifica, através de uma interface visual, um exemplo da estrutura hierárquica do documento e de seu relacionamento com os conceitos da ontologia, gerando uma gramática descritiva da estrutura implícita do mesmo. A partir dessa gramática, a ferramenta realiza a extração dos próximos documentos de forma automática, reestruturando o resultado em um formato regular de dados, neste caso, XML (eXtensible Markup Language). Além da conceituação do método de extração, são apresentados os experimentos realizados com o protótipo da ferramenta, bem como, os resultados obtidos nestes experimentos. Para a construção desta ferramenta, são analisadas características de outros métodos que constituem o estado da arte em extração de dados semi-estruturados.application/pdfporArmazenamento : DadosRecuperacao : InformacaoBanco : Dados semi-estruturadosExtração semânticaExtração semântica de dados semi-estruturados através de exemplos e ferramentas visuaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2001mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000315470.pdf000315470.pdfTexto completoapplication/pdf2498463http://www.lume.ufrgs.br/bitstream/10183/2178/1/000315470.pdfbe5f84a4d3bf2059088438885250827cMD51TEXT000315470.pdf.txt000315470.pdf.txtExtracted Texttext/plain243540http://www.lume.ufrgs.br/bitstream/10183/2178/2/000315470.pdf.txt7729d11932e71aa0eb61c71d8d8bfd1eMD52THUMBNAIL000315470.pdf.jpg000315470.pdf.jpgGenerated Thumbnailimage/jpeg1160http://www.lume.ufrgs.br/bitstream/10183/2178/3/000315470.pdf.jpg68e552d20c836950077ab588c1e1d38bMD5310183/21782018-10-15 09:01:18.785oai:www.lume.ufrgs.br:10183/2178Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-15T12:01:18Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais |
title |
Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais |
spellingShingle |
Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais Silveira, Iraci Cristina da Armazenamento : Dados Recuperacao : Informacao Banco : Dados semi-estruturados Extração semântica |
title_short |
Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais |
title_full |
Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais |
title_fullStr |
Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais |
title_full_unstemmed |
Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais |
title_sort |
Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais |
author |
Silveira, Iraci Cristina da |
author_facet |
Silveira, Iraci Cristina da |
author_role |
author |
dc.contributor.author.fl_str_mv |
Silveira, Iraci Cristina da |
dc.contributor.advisor1.fl_str_mv |
Heuser, Carlos Alberto |
contributor_str_mv |
Heuser, Carlos Alberto |
dc.subject.por.fl_str_mv |
Armazenamento : Dados Recuperacao : Informacao Banco : Dados semi-estruturados Extração semântica |
topic |
Armazenamento : Dados Recuperacao : Informacao Banco : Dados semi-estruturados Extração semântica |
description |
Existe uma necessidade latente de pesquisar, filtrar e manipular informações disponíveis em diversos formatos irregulares, entre elas as informações distribuídas na WWW (World Wide Web). Esses tipos de dados são semi-estruturados, pois não possuem uma estrutura explícita e regular, o que dificulta sua manipulação. Este trabalho apresenta como proposta o projeto de uma ferramenta para realizar a extração semântica e semi-automática de dados semi-estruturados. O usuário especifica, através de uma interface visual, um exemplo da estrutura hierárquica do documento e de seu relacionamento com os conceitos da ontologia, gerando uma gramática descritiva da estrutura implícita do mesmo. A partir dessa gramática, a ferramenta realiza a extração dos próximos documentos de forma automática, reestruturando o resultado em um formato regular de dados, neste caso, XML (eXtensible Markup Language). Além da conceituação do método de extração, são apresentados os experimentos realizados com o protótipo da ferramenta, bem como, os resultados obtidos nestes experimentos. Para a construção desta ferramenta, são analisadas características de outros métodos que constituem o estado da arte em extração de dados semi-estruturados. |
publishDate |
2001 |
dc.date.issued.fl_str_mv |
2001 |
dc.date.accessioned.fl_str_mv |
2007-06-06T17:20:39Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/2178 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000315470 |
url |
http://hdl.handle.net/10183/2178 |
identifier_str_mv |
000315470 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/2178/1/000315470.pdf http://www.lume.ufrgs.br/bitstream/10183/2178/2/000315470.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/2178/3/000315470.pdf.jpg |
bitstream.checksum.fl_str_mv |
be5f84a4d3bf2059088438885250827c 7729d11932e71aa0eb61c71d8d8bfd1e 68e552d20c836950077ab588c1e1d38b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085012763049984 |