Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/151305 |
Resumo: | A busca de informações em bases de dados de instituições que possuem grande volume de dados necessita cada vez mais de processos mais eficientes para realização dessa tarefa. Problemas de grafia, idioma, sinonímia, abreviação de termos e a falta de padronização dos termos, tanto nos argumentos de busca, quanto na indexação dos documentos, interferem diretamente nos resultados. Diante disso, este estudo teve como objetivo avaliar o impacto da adição de vocabulários estruturados da área de Ciências da Saúde no Currículo Lattes, na recuperação de perfis similares de pesquisadores das áreas de Ciências Biológicas e Ciências da Saúde, utilizando técnicas de mineração de dados, expansão de consultas, modelos vetoriais de consultas e utilização de algoritmo de trigramas. Foram realizados cruzamentos de informações entre as palavras-chaves de artigos publicados registrados no Currículo Lattes e as informações contidas no Medical Subject Headings (MeSH) e nos Descritores em Ciências da Saúde (DeCS), bem como comparações entre os resultados das consultas, utilizando as palavras-chaves originais e adicionando-lhes os termos resultantes do processo de expansão de consultas. Os resultados mostram que a metodologia adotada neste estudo pode incrementar qualitativamente o universo de perfis recuperados, podendo dessa forma contribuir para a melhoria dos Sistemas de Informações do Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq. |
id |
URGS_1dfb3570fc82eefc7913d1757ca8c86c |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/151305 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Araújo, Charles Henrique deWyse, Angela Terezinha de Souza2017-01-27T02:19:17Z2016http://hdl.handle.net/10183/151305001011132A busca de informações em bases de dados de instituições que possuem grande volume de dados necessita cada vez mais de processos mais eficientes para realização dessa tarefa. Problemas de grafia, idioma, sinonímia, abreviação de termos e a falta de padronização dos termos, tanto nos argumentos de busca, quanto na indexação dos documentos, interferem diretamente nos resultados. Diante disso, este estudo teve como objetivo avaliar o impacto da adição de vocabulários estruturados da área de Ciências da Saúde no Currículo Lattes, na recuperação de perfis similares de pesquisadores das áreas de Ciências Biológicas e Ciências da Saúde, utilizando técnicas de mineração de dados, expansão de consultas, modelos vetoriais de consultas e utilização de algoritmo de trigramas. Foram realizados cruzamentos de informações entre as palavras-chaves de artigos publicados registrados no Currículo Lattes e as informações contidas no Medical Subject Headings (MeSH) e nos Descritores em Ciências da Saúde (DeCS), bem como comparações entre os resultados das consultas, utilizando as palavras-chaves originais e adicionando-lhes os termos resultantes do processo de expansão de consultas. Os resultados mostram que a metodologia adotada neste estudo pode incrementar qualitativamente o universo de perfis recuperados, podendo dessa forma contribuir para a melhoria dos Sistemas de Informações do Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq.Information retrieval in large databases need increasingly more efficient ways for accomplishing this task. There are many problems, like spelling, language, synonym, acronyms, lack of standardization of terms, both in the search arguments, as in the indexing of documents. They directly interfere in the results. Thus, this study aimed to evaluate the impact of the addition of structured vocabularies of Health Sciences area in Lattes Database, in the recovery of similar profiles of researchers that work in Biological Sciences and Health Sciences, using Query Expansion, Data Mining procedures, Vector Models and Trigram Phrase Matching algorithm. Crosschecking keywords of articles registered in Lattes Database and Medical Subject Headings (MeSH) and Health Sciences Descriptors (DeCS) terms, as well as comparisons between the results of queries using the original keywords and adding them to query expansion terms. The results show that the methodology used in this study can qualitatively increase the set of recovered profiles, contributing to the improvement of CNPq Information Systems.application/pdfporVocabulário controladoSistemas de recomendaçãoRecuperação da informaçãoCiências da saúdeQuery expansionData miningRecommendation systemsEstudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de Ciências Básicas da SaúdePrograma de Pós-Graduação em Educação em Ciências: Química da Vida e SaúdePorto Alegre, BR-RS2016mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001011132.pdf001011132.pdfTexto completoapplication/pdf1066702http://www.lume.ufrgs.br/bitstream/10183/151305/1/001011132.pdf71146d759aa9d0f0d97d3b9651844c41MD51TEXT001011132.pdf.txt001011132.pdf.txtExtracted Texttext/plain131822http://www.lume.ufrgs.br/bitstream/10183/151305/2/001011132.pdf.txt835fa7d8cb83535c389c0f5bf51754f3MD5210183/1513052017-01-28 02:23:07.536266oai:www.lume.ufrgs.br:10183/151305Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532017-01-28T04:23:07Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes |
title |
Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes |
spellingShingle |
Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes Araújo, Charles Henrique de Vocabulário controlado Sistemas de recomendação Recuperação da informação Ciências da saúde Query expansion Data mining Recommendation systems |
title_short |
Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes |
title_full |
Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes |
title_fullStr |
Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes |
title_full_unstemmed |
Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes |
title_sort |
Estudo sobre o impacto da adição de vocabulários estruturados da área de ciências da saúde no Currículo Lattes |
author |
Araújo, Charles Henrique de |
author_facet |
Araújo, Charles Henrique de |
author_role |
author |
dc.contributor.author.fl_str_mv |
Araújo, Charles Henrique de |
dc.contributor.advisor1.fl_str_mv |
Wyse, Angela Terezinha de Souza |
contributor_str_mv |
Wyse, Angela Terezinha de Souza |
dc.subject.por.fl_str_mv |
Vocabulário controlado Sistemas de recomendação Recuperação da informação Ciências da saúde |
topic |
Vocabulário controlado Sistemas de recomendação Recuperação da informação Ciências da saúde Query expansion Data mining Recommendation systems |
dc.subject.eng.fl_str_mv |
Query expansion Data mining Recommendation systems |
description |
A busca de informações em bases de dados de instituições que possuem grande volume de dados necessita cada vez mais de processos mais eficientes para realização dessa tarefa. Problemas de grafia, idioma, sinonímia, abreviação de termos e a falta de padronização dos termos, tanto nos argumentos de busca, quanto na indexação dos documentos, interferem diretamente nos resultados. Diante disso, este estudo teve como objetivo avaliar o impacto da adição de vocabulários estruturados da área de Ciências da Saúde no Currículo Lattes, na recuperação de perfis similares de pesquisadores das áreas de Ciências Biológicas e Ciências da Saúde, utilizando técnicas de mineração de dados, expansão de consultas, modelos vetoriais de consultas e utilização de algoritmo de trigramas. Foram realizados cruzamentos de informações entre as palavras-chaves de artigos publicados registrados no Currículo Lattes e as informações contidas no Medical Subject Headings (MeSH) e nos Descritores em Ciências da Saúde (DeCS), bem como comparações entre os resultados das consultas, utilizando as palavras-chaves originais e adicionando-lhes os termos resultantes do processo de expansão de consultas. Os resultados mostram que a metodologia adotada neste estudo pode incrementar qualitativamente o universo de perfis recuperados, podendo dessa forma contribuir para a melhoria dos Sistemas de Informações do Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq. |
publishDate |
2016 |
dc.date.issued.fl_str_mv |
2016 |
dc.date.accessioned.fl_str_mv |
2017-01-27T02:19:17Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/151305 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001011132 |
url |
http://hdl.handle.net/10183/151305 |
identifier_str_mv |
001011132 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/151305/1/001011132.pdf http://www.lume.ufrgs.br/bitstream/10183/151305/2/001011132.pdf.txt |
bitstream.checksum.fl_str_mv |
71146d759aa9d0f0d97d3b9651844c41 835fa7d8cb83535c389c0f5bf51754f3 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1800309099262377984 |