Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes

Detalhes bibliográficos
Autor(a) principal: Araújo, Charles Henrique de
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/151305
Resumo: A busca de informações em bases de dados de instituições que possuem grande volume de dados necessita cada vez mais de processos mais eficientes para realização dessa tarefa. Problemas de grafia, idioma, sinonímia, abreviação de termos e a falta de padronização dos termos, tanto nos argumentos de busca, quanto na indexação dos documentos, interferem diretamente nos resultados. Diante disso, este estudo teve como objetivo avaliar o impacto da adição de vocabulários estruturados da área de Ciências da Saúde no Currículo Lattes, na recuperação de perfis similares de pesquisadores das áreas de Ciências Biológicas e Ciências da Saúde, utilizando técnicas de mineração de dados, expansão de consultas, modelos vetoriais de consultas e utilização de algoritmo de trigramas. Foram realizados cruzamentos de informações entre as palavras-chaves de artigos publicados registrados no Currículo Lattes e as informações contidas no Medical Subject Headings (MeSH) e nos Descritores em Ciências da Saúde (DeCS), bem como comparações entre os resultados das consultas, utilizando as palavras-chaves originais e adicionando-lhes os termos resultantes do processo de expansão de consultas. Os resultados mostram que a metodologia adotada neste estudo pode incrementar qualitativamente o universo de perfis recuperados, podendo dessa forma contribuir para a melhoria dos Sistemas de Informações do Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq.
id URGS_1dfb3570fc82eefc7913d1757ca8c86c
oai_identifier_str oai:www.lume.ufrgs.br:10183/151305
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Araújo, Charles Henrique deWyse, Angela Terezinha de Souza2017-01-27T02:19:17Z2016http://hdl.handle.net/10183/151305001011132A busca de informações em bases de dados de instituições que possuem grande volume de dados necessita cada vez mais de processos mais eficientes para realização dessa tarefa. Problemas de grafia, idioma, sinonímia, abreviação de termos e a falta de padronização dos termos, tanto nos argumentos de busca, quanto na indexação dos documentos, interferem diretamente nos resultados. Diante disso, este estudo teve como objetivo avaliar o impacto da adição de vocabulários estruturados da área de Ciências da Saúde no Currículo Lattes, na recuperação de perfis similares de pesquisadores das áreas de Ciências Biológicas e Ciências da Saúde, utilizando técnicas de mineração de dados, expansão de consultas, modelos vetoriais de consultas e utilização de algoritmo de trigramas. Foram realizados cruzamentos de informações entre as palavras-chaves de artigos publicados registrados no Currículo Lattes e as informações contidas no Medical Subject Headings (MeSH) e nos Descritores em Ciências da Saúde (DeCS), bem como comparações entre os resultados das consultas, utilizando as palavras-chaves originais e adicionando-lhes os termos resultantes do processo de expansão de consultas. Os resultados mostram que a metodologia adotada neste estudo pode incrementar qualitativamente o universo de perfis recuperados, podendo dessa forma contribuir para a melhoria dos Sistemas de Informações do Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq.Information retrieval in large databases need increasingly more efficient ways for accomplishing this task. There are many problems, like spelling, language, synonym, acronyms, lack of standardization of terms, both in the search arguments, as in the indexing of documents. They directly interfere in the results. Thus, this study aimed to evaluate the impact of the addition of structured vocabularies of Health Sciences area in Lattes Database, in the recovery of similar profiles of researchers that work in Biological Sciences and Health Sciences, using Query Expansion, Data Mining procedures, Vector Models and Trigram Phrase Matching algorithm. Crosschecking keywords of articles registered in Lattes Database and Medical Subject Headings (MeSH) and Health Sciences Descriptors (DeCS) terms, as well as comparisons between the results of queries using the original keywords and adding them to query expansion terms. The results show that the methodology used in this study can qualitatively increase the set of recovered profiles, contributing to the improvement of CNPq Information Systems.application/pdfporVocabulário controladoSistemas de recomendaçãoRecuperação da informaçãoCiências da saúdeQuery expansionData miningRecommendation systemsEstudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de Ciências Básicas da SaúdePrograma de Pós-Graduação em Educação em Ciências: Química da Vida e SaúdePorto Alegre, BR-RS2016mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001011132.pdf001011132.pdfTexto completoapplication/pdf1066702http://www.lume.ufrgs.br/bitstream/10183/151305/1/001011132.pdf71146d759aa9d0f0d97d3b9651844c41MD51TEXT001011132.pdf.txt001011132.pdf.txtExtracted Texttext/plain131822http://www.lume.ufrgs.br/bitstream/10183/151305/2/001011132.pdf.txt835fa7d8cb83535c389c0f5bf51754f3MD5210183/1513052017-01-28 02:23:07.536266oai:www.lume.ufrgs.br:10183/151305Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532017-01-28T04:23:07Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
title Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
spellingShingle Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
Araújo, Charles Henrique de
Vocabulário controlado
Sistemas de recomendação
Recuperação da informação
Ciências da saúde
Query expansion
Data mining
Recommendation systems
title_short Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
title_full Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
title_fullStr Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
title_full_unstemmed Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
title_sort Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
author Araújo, Charles Henrique de
author_facet Araújo, Charles Henrique de
author_role author
dc.contributor.author.fl_str_mv Araújo, Charles Henrique de
dc.contributor.advisor1.fl_str_mv Wyse, Angela Terezinha de Souza
contributor_str_mv Wyse, Angela Terezinha de Souza
dc.subject.por.fl_str_mv Vocabulário controlado
Sistemas de recomendação
Recuperação da informação
Ciências da saúde
topic Vocabulário controlado
Sistemas de recomendação
Recuperação da informação
Ciências da saúde
Query expansion
Data mining
Recommendation systems
dc.subject.eng.fl_str_mv Query expansion
Data mining
Recommendation systems
description A busca de informações em bases de dados de instituições que possuem grande volume de dados necessita cada vez mais de processos mais eficientes para realização dessa tarefa. Problemas de grafia, idioma, sinonímia, abreviação de termos e a falta de padronização dos termos, tanto nos argumentos de busca, quanto na indexação dos documentos, interferem diretamente nos resultados. Diante disso, este estudo teve como objetivo avaliar o impacto da adição de vocabulários estruturados da área de Ciências da Saúde no Currículo Lattes, na recuperação de perfis similares de pesquisadores das áreas de Ciências Biológicas e Ciências da Saúde, utilizando técnicas de mineração de dados, expansão de consultas, modelos vetoriais de consultas e utilização de algoritmo de trigramas. Foram realizados cruzamentos de informações entre as palavras-chaves de artigos publicados registrados no Currículo Lattes e as informações contidas no Medical Subject Headings (MeSH) e nos Descritores em Ciências da Saúde (DeCS), bem como comparações entre os resultados das consultas, utilizando as palavras-chaves originais e adicionando-lhes os termos resultantes do processo de expansão de consultas. Os resultados mostram que a metodologia adotada neste estudo pode incrementar qualitativamente o universo de perfis recuperados, podendo dessa forma contribuir para a melhoria dos Sistemas de Informações do Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq.
publishDate 2016
dc.date.issued.fl_str_mv 2016
dc.date.accessioned.fl_str_mv 2017-01-27T02:19:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/151305
dc.identifier.nrb.pt_BR.fl_str_mv 001011132
url http://hdl.handle.net/10183/151305
identifier_str_mv 001011132
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/151305/1/001011132.pdf
http://www.lume.ufrgs.br/bitstream/10183/151305/2/001011132.pdf.txt
bitstream.checksum.fl_str_mv 71146d759aa9d0f0d97d3b9651844c41
835fa7d8cb83535c389c0f5bf51754f3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1800309099262377984