Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia

Detalhes bibliográficos
Autor(a) principal: Silva, Ana Carla Macedo da
Data de Publicação: 2002
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/4279
Resumo: Este trabalho faz avaliação de ferramentas que utilizam técnica de Descoberta de Conhecimento em Texto (agrupamento ou “clustering”). As duas ferramentas são: Eurekha e Umap. O Eurekha é baseado na hipótese de agrupamento, que afirma que documentos similares e relevantes ao mesmo assunto tendem a permanecer em um mesmo grupo. O Umap, por sua vez, é baseado na árvore do conhecimento. A mesma coleção de documentos submetida às ferramentas foi lida por um especialista humano, que agrupou textos similares, a fim de que seus resultados fossem comparados aos das ferramentas. Com isso, pretende-se responder a seguinte questão: a recuperação automática é equivalente à recuperação humana? A coleção de teste é composta por matérias do jornal Folha de São Paulo, cujo tema central é a Amazônia. Com os resultados, pretende-se verificar a validade das ferramentas, os conhecimentos obtidos sobre a região e o tratamento que o jornal dá em relação à mesma.
id URGS_aadc08ee0467fdd496f125e6ee6f6e09
oai_identifier_str oai:www.lume.ufrgs.br:10183/4279
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Silva, Ana Carla Macedo daOliveira, Jose Palazzo Moreira de2007-06-06T17:35:09Z2002http://hdl.handle.net/10183/4279000409584Este trabalho faz avaliação de ferramentas que utilizam técnica de Descoberta de Conhecimento em Texto (agrupamento ou “clustering”). As duas ferramentas são: Eurekha e Umap. O Eurekha é baseado na hipótese de agrupamento, que afirma que documentos similares e relevantes ao mesmo assunto tendem a permanecer em um mesmo grupo. O Umap, por sua vez, é baseado na árvore do conhecimento. A mesma coleção de documentos submetida às ferramentas foi lida por um especialista humano, que agrupou textos similares, a fim de que seus resultados fossem comparados aos das ferramentas. Com isso, pretende-se responder a seguinte questão: a recuperação automática é equivalente à recuperação humana? A coleção de teste é composta por matérias do jornal Folha de São Paulo, cujo tema central é a Amazônia. Com os resultados, pretende-se verificar a validade das ferramentas, os conhecimentos obtidos sobre a região e o tratamento que o jornal dá em relação à mesma.application/pdfporRecuperacao : InformacaoDescoberta : ConhecimentoUm estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazôniainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2002mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000409584.pdf000409584.pdfTexto completoapplication/pdf2079934http://www.lume.ufrgs.br/bitstream/10183/4279/1/000409584.pdf0f5dac178fe8ef2f3b79eedc86cf3fedMD51TEXT000409584.pdf.txt000409584.pdf.txtExtracted Texttext/plain282171http://www.lume.ufrgs.br/bitstream/10183/4279/2/000409584.pdf.txt119fb0af60caa9fd7de2cbaba52c24cbMD52THUMBNAIL000409584.pdf.jpg000409584.pdf.jpgGenerated Thumbnailimage/jpeg1167http://www.lume.ufrgs.br/bitstream/10183/4279/3/000409584.pdf.jpgeb1c1bfea07b1ccf24aa2c888a165214MD5310183/42792018-10-15 09:08:59.407oai:www.lume.ufrgs.br:10183/4279Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-15T12:08:59Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia
title Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia
spellingShingle Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia
Silva, Ana Carla Macedo da
Recuperacao : Informacao
Descoberta : Conhecimento
title_short Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia
title_full Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia
title_fullStr Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia
title_full_unstemmed Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia
title_sort Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia
author Silva, Ana Carla Macedo da
author_facet Silva, Ana Carla Macedo da
author_role author
dc.contributor.author.fl_str_mv Silva, Ana Carla Macedo da
dc.contributor.advisor1.fl_str_mv Oliveira, Jose Palazzo Moreira de
contributor_str_mv Oliveira, Jose Palazzo Moreira de
dc.subject.por.fl_str_mv Recuperacao : Informacao
Descoberta : Conhecimento
topic Recuperacao : Informacao
Descoberta : Conhecimento
description Este trabalho faz avaliação de ferramentas que utilizam técnica de Descoberta de Conhecimento em Texto (agrupamento ou “clustering”). As duas ferramentas são: Eurekha e Umap. O Eurekha é baseado na hipótese de agrupamento, que afirma que documentos similares e relevantes ao mesmo assunto tendem a permanecer em um mesmo grupo. O Umap, por sua vez, é baseado na árvore do conhecimento. A mesma coleção de documentos submetida às ferramentas foi lida por um especialista humano, que agrupou textos similares, a fim de que seus resultados fossem comparados aos das ferramentas. Com isso, pretende-se responder a seguinte questão: a recuperação automática é equivalente à recuperação humana? A coleção de teste é composta por matérias do jornal Folha de São Paulo, cujo tema central é a Amazônia. Com os resultados, pretende-se verificar a validade das ferramentas, os conhecimentos obtidos sobre a região e o tratamento que o jornal dá em relação à mesma.
publishDate 2002
dc.date.issued.fl_str_mv 2002
dc.date.accessioned.fl_str_mv 2007-06-06T17:35:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/4279
dc.identifier.nrb.pt_BR.fl_str_mv 000409584
url http://hdl.handle.net/10183/4279
identifier_str_mv 000409584
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/4279/1/000409584.pdf
http://www.lume.ufrgs.br/bitstream/10183/4279/2/000409584.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/4279/3/000409584.pdf.jpg
bitstream.checksum.fl_str_mv 0f5dac178fe8ef2f3b79eedc86cf3fed
119fb0af60caa9fd7de2cbaba52c24cb
eb1c1bfea07b1ccf24aa2c888a165214
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085039455600640