Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia
Autor(a) principal: | |
---|---|
Data de Publicação: | 2002 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/4279 |
Resumo: | Este trabalho faz avaliação de ferramentas que utilizam técnica de Descoberta de Conhecimento em Texto (agrupamento ou “clustering”). As duas ferramentas são: Eurekha e Umap. O Eurekha é baseado na hipótese de agrupamento, que afirma que documentos similares e relevantes ao mesmo assunto tendem a permanecer em um mesmo grupo. O Umap, por sua vez, é baseado na árvore do conhecimento. A mesma coleção de documentos submetida às ferramentas foi lida por um especialista humano, que agrupou textos similares, a fim de que seus resultados fossem comparados aos das ferramentas. Com isso, pretende-se responder a seguinte questão: a recuperação automática é equivalente à recuperação humana? A coleção de teste é composta por matérias do jornal Folha de São Paulo, cujo tema central é a Amazônia. Com os resultados, pretende-se verificar a validade das ferramentas, os conhecimentos obtidos sobre a região e o tratamento que o jornal dá em relação à mesma. |
id |
URGS_aadc08ee0467fdd496f125e6ee6f6e09 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/4279 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Silva, Ana Carla Macedo daOliveira, Jose Palazzo Moreira de2007-06-06T17:35:09Z2002http://hdl.handle.net/10183/4279000409584Este trabalho faz avaliação de ferramentas que utilizam técnica de Descoberta de Conhecimento em Texto (agrupamento ou “clustering”). As duas ferramentas são: Eurekha e Umap. O Eurekha é baseado na hipótese de agrupamento, que afirma que documentos similares e relevantes ao mesmo assunto tendem a permanecer em um mesmo grupo. O Umap, por sua vez, é baseado na árvore do conhecimento. A mesma coleção de documentos submetida às ferramentas foi lida por um especialista humano, que agrupou textos similares, a fim de que seus resultados fossem comparados aos das ferramentas. Com isso, pretende-se responder a seguinte questão: a recuperação automática é equivalente à recuperação humana? A coleção de teste é composta por matérias do jornal Folha de São Paulo, cujo tema central é a Amazônia. Com os resultados, pretende-se verificar a validade das ferramentas, os conhecimentos obtidos sobre a região e o tratamento que o jornal dá em relação à mesma.application/pdfporRecuperacao : InformacaoDescoberta : ConhecimentoUm estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazôniainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2002mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000409584.pdf000409584.pdfTexto completoapplication/pdf2079934http://www.lume.ufrgs.br/bitstream/10183/4279/1/000409584.pdf0f5dac178fe8ef2f3b79eedc86cf3fedMD51TEXT000409584.pdf.txt000409584.pdf.txtExtracted Texttext/plain282171http://www.lume.ufrgs.br/bitstream/10183/4279/2/000409584.pdf.txt119fb0af60caa9fd7de2cbaba52c24cbMD52THUMBNAIL000409584.pdf.jpg000409584.pdf.jpgGenerated Thumbnailimage/jpeg1167http://www.lume.ufrgs.br/bitstream/10183/4279/3/000409584.pdf.jpgeb1c1bfea07b1ccf24aa2c888a165214MD5310183/42792018-10-15 09:08:59.407oai:www.lume.ufrgs.br:10183/4279Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-15T12:08:59Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia |
title |
Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia |
spellingShingle |
Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia Silva, Ana Carla Macedo da Recuperacao : Informacao Descoberta : Conhecimento |
title_short |
Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia |
title_full |
Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia |
title_fullStr |
Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia |
title_full_unstemmed |
Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia |
title_sort |
Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia |
author |
Silva, Ana Carla Macedo da |
author_facet |
Silva, Ana Carla Macedo da |
author_role |
author |
dc.contributor.author.fl_str_mv |
Silva, Ana Carla Macedo da |
dc.contributor.advisor1.fl_str_mv |
Oliveira, Jose Palazzo Moreira de |
contributor_str_mv |
Oliveira, Jose Palazzo Moreira de |
dc.subject.por.fl_str_mv |
Recuperacao : Informacao Descoberta : Conhecimento |
topic |
Recuperacao : Informacao Descoberta : Conhecimento |
description |
Este trabalho faz avaliação de ferramentas que utilizam técnica de Descoberta de Conhecimento em Texto (agrupamento ou “clustering”). As duas ferramentas são: Eurekha e Umap. O Eurekha é baseado na hipótese de agrupamento, que afirma que documentos similares e relevantes ao mesmo assunto tendem a permanecer em um mesmo grupo. O Umap, por sua vez, é baseado na árvore do conhecimento. A mesma coleção de documentos submetida às ferramentas foi lida por um especialista humano, que agrupou textos similares, a fim de que seus resultados fossem comparados aos das ferramentas. Com isso, pretende-se responder a seguinte questão: a recuperação automática é equivalente à recuperação humana? A coleção de teste é composta por matérias do jornal Folha de São Paulo, cujo tema central é a Amazônia. Com os resultados, pretende-se verificar a validade das ferramentas, os conhecimentos obtidos sobre a região e o tratamento que o jornal dá em relação à mesma. |
publishDate |
2002 |
dc.date.issued.fl_str_mv |
2002 |
dc.date.accessioned.fl_str_mv |
2007-06-06T17:35:09Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/4279 |
dc.identifier.nrb.pt_BR.fl_str_mv |
000409584 |
url |
http://hdl.handle.net/10183/4279 |
identifier_str_mv |
000409584 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/4279/1/000409584.pdf http://www.lume.ufrgs.br/bitstream/10183/4279/2/000409584.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/4279/3/000409584.pdf.jpg |
bitstream.checksum.fl_str_mv |
0f5dac178fe8ef2f3b79eedc86cf3fed 119fb0af60caa9fd7de2cbaba52c24cb eb1c1bfea07b1ccf24aa2c888a165214 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085039455600640 |