Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina

Detalhes bibliográficos
Autor(a) principal: Ferreira, Leonardo Zanini
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPel - Guaiaca
Texto Completo: http://repositorio.ufpel.edu.br/handle/prefix/3848
Resumo: O monitoramento do desenvolvimento dos indicadores de saúde e nutrição dos países depende de dados precisos e completos. Países de baixa e média renda dependem de inquéritos populacionais para tomada de decisões, já que seus sistemas de informação ainda são precários. Estes indicadores são desfechos de saúde que indicam a situação de uma intervenção, comportamento ou cuidado de saúde materno-infantil. Apesar de serem ótimas fontes de informação, os inquéritos populacionais também possuem informações incompletas que podem inviabilizar a construção destes indicadores de forma padronizada. O aprendizado de máquina surge como uma alternativa para completar estas lacunas existentes nos inquéritos com base em características sociodemográficas e preditores relacionados. Este trabalho avalia o desempenho de quatro técnicas de aprendizado de máquina (redes neurais, árvores de decisão, KNN e XGB) nesta tarefa, observando o comportamento de dois desfechos de saúde em quatro amostras diferentes. Os resultados apontam para a existência de uma grande variação no desempenho de acordo com o desfecho selecionado. A disponibilidade dos mesmos indicadores como preditores também é um desafio enfrentado. As técnicas de aprendizado de máquina estudadas apresentaram pouca variação de desempenho entre elas, o que sugere que a natureza dos dados é um fator determinante neste tipo de aplicação. Contudo, o primeiro desfecho apresentou resultados aceitáveis para uma aplicação prática, enquanto o segundo desfecho atingiu estimativas inferiores ao que especialistas consideram como um desempenho razoável.
id UFPL_68e827da3c33b3eec8acaf64da1538c6
oai_identifier_str oai:guaiaca.ufpel.edu.br:prefix/3848
network_acronym_str UFPL
network_name_str Repositório Institucional da UFPel - Guaiaca
repository_id_str
spelling 2018-04-19T14:45:34Z2018-04-19T14:45:34Z2018-02-06FERREIRA, Leonardo Zanini. Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina. 2018. 87 f. Dissertação (Mestrado) – Programa de Pós-Graduação em Computação, Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, 2018.http://repositorio.ufpel.edu.br/handle/prefix/3848O monitoramento do desenvolvimento dos indicadores de saúde e nutrição dos países depende de dados precisos e completos. Países de baixa e média renda dependem de inquéritos populacionais para tomada de decisões, já que seus sistemas de informação ainda são precários. Estes indicadores são desfechos de saúde que indicam a situação de uma intervenção, comportamento ou cuidado de saúde materno-infantil. Apesar de serem ótimas fontes de informação, os inquéritos populacionais também possuem informações incompletas que podem inviabilizar a construção destes indicadores de forma padronizada. O aprendizado de máquina surge como uma alternativa para completar estas lacunas existentes nos inquéritos com base em características sociodemográficas e preditores relacionados. Este trabalho avalia o desempenho de quatro técnicas de aprendizado de máquina (redes neurais, árvores de decisão, KNN e XGB) nesta tarefa, observando o comportamento de dois desfechos de saúde em quatro amostras diferentes. Os resultados apontam para a existência de uma grande variação no desempenho de acordo com o desfecho selecionado. A disponibilidade dos mesmos indicadores como preditores também é um desafio enfrentado. As técnicas de aprendizado de máquina estudadas apresentaram pouca variação de desempenho entre elas, o que sugere que a natureza dos dados é um fator determinante neste tipo de aplicação. Contudo, o primeiro desfecho apresentou resultados aceitáveis para uma aplicação prática, enquanto o segundo desfecho atingiu estimativas inferiores ao que especialistas consideram como um desempenho razoável.Monitoring the development of countries’ health and nutrition indicators rely on accurate and complete data. Low-and middle-income countries depend on populational surveys for decision-making since their information systems are still unreliable. These indicators are health outcomes which point out the status of a maternal and child health intervention, behavior or care. Despite being great sources of information, the populational surveys also lack information which could prevent the creation of these standardized indicators. Machine learning arise as an alternative to fill the gaps found in the surveys based on sociodemographic characteristics and related predictors. This work evaluates the performance of four machine learning techniques (neural networks, decision trees, KNN and XGB) in this task by observing the behavior of two health outcomes in four different samples. The results indicate that a great variation can be found depending on the selected outcome. The availability of those indicators as predictors is also a challenge. The studied machine learning techniques presented a small performance variation between themselves which suggests that the nature of the data is determinant to this kind of application. Still, the first outcomes showed acceptable results for a practical application while the second outcome reached lower estimates compared to those which specialists consider as a reasonable performance.Sem bolsaporUniversidade Federal de PelotasPrograma de Pós-Graduação em ComputaçãoUFPelBrasilCentro de Desenvolvimento TecnológicoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado de máquinaDesfechos de saúdeInquéritos populacionais de saúdeMachine learningHealth outcomesPopulational health surveysPredição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquinaData prediction in populational surveys using machine learning techniquesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://lattes.cnpq.br/8804473439219857http://lattes.cnpq.br/1544604888519188Fleischmann, Ana Marilza Pernashttp://lattes.cnpq.br/1435405686437314Araújo, Ricardo Matsumura deFerreira, Leonardo Zaniniinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPel - Guaiacainstname:Universidade Federal de Pelotas (UFPEL)instacron:UFPELTEXTDissertacao_Leonardo_Ferreira.pdf.txtDissertacao_Leonardo_Ferreira.pdf.txtExtracted texttext/plain132415http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/6/Dissertacao_Leonardo_Ferreira.pdf.txtebd9a3293f96f86b12db9112117d65f6MD56open accessTHUMBNAILDissertacao_Leonardo_Ferreira.pdf.jpgDissertacao_Leonardo_Ferreira.pdf.jpgGenerated Thumbnailimage/jpeg1206http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/7/Dissertacao_Leonardo_Ferreira.pdf.jpgd944a0dadc4dbc90b5f35af91793349dMD57open accessORIGINALDissertacao_Leonardo_Ferreira.pdfDissertacao_Leonardo_Ferreira.pdfapplication/pdf1173663http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/1/Dissertacao_Leonardo_Ferreira.pdf384c6abb1e58fbe7d32878fbb1484979MD51open accessCC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52open accesslicense_textlicense_texttext/html; charset=utf-80http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53open accesslicense_rdflicense_rdfapplication/rdf+xml; charset=utf-80http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/4/license_rdfd41d8cd98f00b204e9800998ecf8427eMD54open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-81866http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/5/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD55open accessprefix/38482023-07-13 03:07:41.026open accessoai:guaiaca.ufpel.edu.br:prefix/3848TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttp://repositorio.ufpel.edu.br/oai/requestrippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.bropendoar:2023-07-13T06:07:41Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)false
dc.title.pt_BR.fl_str_mv Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina
dc.title.alternative.pt_BR.fl_str_mv Data prediction in populational surveys using machine learning techniques
title Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina
spellingShingle Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina
Ferreira, Leonardo Zanini
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Aprendizado de máquina
Desfechos de saúde
Inquéritos populacionais de saúde
Machine learning
Health outcomes
Populational health surveys
title_short Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina
title_full Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina
title_fullStr Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina
title_full_unstemmed Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina
title_sort Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina
author Ferreira, Leonardo Zanini
author_facet Ferreira, Leonardo Zanini
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/8804473439219857
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1544604888519188
dc.contributor.advisor-co2.fl_str_mv Fleischmann, Ana Marilza Pernas
dc.contributor.advisor-co2Lattes.fl_str_mv http://lattes.cnpq.br/1435405686437314
dc.contributor.advisor1.fl_str_mv Araújo, Ricardo Matsumura de
dc.contributor.author.fl_str_mv Ferreira, Leonardo Zanini
contributor_str_mv Fleischmann, Ana Marilza Pernas
Araújo, Ricardo Matsumura de
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Aprendizado de máquina
Desfechos de saúde
Inquéritos populacionais de saúde
Machine learning
Health outcomes
Populational health surveys
dc.subject.por.fl_str_mv Aprendizado de máquina
Desfechos de saúde
Inquéritos populacionais de saúde
Machine learning
Health outcomes
Populational health surveys
description O monitoramento do desenvolvimento dos indicadores de saúde e nutrição dos países depende de dados precisos e completos. Países de baixa e média renda dependem de inquéritos populacionais para tomada de decisões, já que seus sistemas de informação ainda são precários. Estes indicadores são desfechos de saúde que indicam a situação de uma intervenção, comportamento ou cuidado de saúde materno-infantil. Apesar de serem ótimas fontes de informação, os inquéritos populacionais também possuem informações incompletas que podem inviabilizar a construção destes indicadores de forma padronizada. O aprendizado de máquina surge como uma alternativa para completar estas lacunas existentes nos inquéritos com base em características sociodemográficas e preditores relacionados. Este trabalho avalia o desempenho de quatro técnicas de aprendizado de máquina (redes neurais, árvores de decisão, KNN e XGB) nesta tarefa, observando o comportamento de dois desfechos de saúde em quatro amostras diferentes. Os resultados apontam para a existência de uma grande variação no desempenho de acordo com o desfecho selecionado. A disponibilidade dos mesmos indicadores como preditores também é um desafio enfrentado. As técnicas de aprendizado de máquina estudadas apresentaram pouca variação de desempenho entre elas, o que sugere que a natureza dos dados é um fator determinante neste tipo de aplicação. Contudo, o primeiro desfecho apresentou resultados aceitáveis para uma aplicação prática, enquanto o segundo desfecho atingiu estimativas inferiores ao que especialistas consideram como um desempenho razoável.
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-04-19T14:45:34Z
dc.date.available.fl_str_mv 2018-04-19T14:45:34Z
dc.date.issued.fl_str_mv 2018-02-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FERREIRA, Leonardo Zanini. Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina. 2018. 87 f. Dissertação (Mestrado) – Programa de Pós-Graduação em Computação, Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, 2018.
dc.identifier.uri.fl_str_mv http://repositorio.ufpel.edu.br/handle/prefix/3848
identifier_str_mv FERREIRA, Leonardo Zanini. Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina. 2018. 87 f. Dissertação (Mestrado) – Programa de Pós-Graduação em Computação, Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, 2018.
url http://repositorio.ufpel.edu.br/handle/prefix/3848
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pelotas
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Computação
dc.publisher.initials.fl_str_mv UFPel
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Centro de Desenvolvimento Tecnológico
publisher.none.fl_str_mv Universidade Federal de Pelotas
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPel - Guaiaca
instname:Universidade Federal de Pelotas (UFPEL)
instacron:UFPEL
instname_str Universidade Federal de Pelotas (UFPEL)
instacron_str UFPEL
institution UFPEL
reponame_str Repositório Institucional da UFPel - Guaiaca
collection Repositório Institucional da UFPel - Guaiaca
bitstream.url.fl_str_mv http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/6/Dissertacao_Leonardo_Ferreira.pdf.txt
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/7/Dissertacao_Leonardo_Ferreira.pdf.jpg
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/1/Dissertacao_Leonardo_Ferreira.pdf
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/2/license_url
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/3/license_text
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/4/license_rdf
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/5/license.txt
bitstream.checksum.fl_str_mv ebd9a3293f96f86b12db9112117d65f6
d944a0dadc4dbc90b5f35af91793349d
384c6abb1e58fbe7d32878fbb1484979
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
43cd690d6a359e86c1fe3d5b7cba0c9b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)
repository.mail.fl_str_mv rippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.br
_version_ 1813710075795079168