Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPel - Guaiaca |
Texto Completo: | http://repositorio.ufpel.edu.br/handle/prefix/3848 |
Resumo: | O monitoramento do desenvolvimento dos indicadores de saúde e nutrição dos países depende de dados precisos e completos. Países de baixa e média renda dependem de inquéritos populacionais para tomada de decisões, já que seus sistemas de informação ainda são precários. Estes indicadores são desfechos de saúde que indicam a situação de uma intervenção, comportamento ou cuidado de saúde materno-infantil. Apesar de serem ótimas fontes de informação, os inquéritos populacionais também possuem informações incompletas que podem inviabilizar a construção destes indicadores de forma padronizada. O aprendizado de máquina surge como uma alternativa para completar estas lacunas existentes nos inquéritos com base em características sociodemográficas e preditores relacionados. Este trabalho avalia o desempenho de quatro técnicas de aprendizado de máquina (redes neurais, árvores de decisão, KNN e XGB) nesta tarefa, observando o comportamento de dois desfechos de saúde em quatro amostras diferentes. Os resultados apontam para a existência de uma grande variação no desempenho de acordo com o desfecho selecionado. A disponibilidade dos mesmos indicadores como preditores também é um desafio enfrentado. As técnicas de aprendizado de máquina estudadas apresentaram pouca variação de desempenho entre elas, o que sugere que a natureza dos dados é um fator determinante neste tipo de aplicação. Contudo, o primeiro desfecho apresentou resultados aceitáveis para uma aplicação prática, enquanto o segundo desfecho atingiu estimativas inferiores ao que especialistas consideram como um desempenho razoável. |
id |
UFPL_68e827da3c33b3eec8acaf64da1538c6 |
---|---|
oai_identifier_str |
oai:guaiaca.ufpel.edu.br:prefix/3848 |
network_acronym_str |
UFPL |
network_name_str |
Repositório Institucional da UFPel - Guaiaca |
repository_id_str |
|
spelling |
2018-04-19T14:45:34Z2018-04-19T14:45:34Z2018-02-06FERREIRA, Leonardo Zanini. Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina. 2018. 87 f. Dissertação (Mestrado) – Programa de Pós-Graduação em Computação, Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, 2018.http://repositorio.ufpel.edu.br/handle/prefix/3848O monitoramento do desenvolvimento dos indicadores de saúde e nutrição dos países depende de dados precisos e completos. Países de baixa e média renda dependem de inquéritos populacionais para tomada de decisões, já que seus sistemas de informação ainda são precários. Estes indicadores são desfechos de saúde que indicam a situação de uma intervenção, comportamento ou cuidado de saúde materno-infantil. Apesar de serem ótimas fontes de informação, os inquéritos populacionais também possuem informações incompletas que podem inviabilizar a construção destes indicadores de forma padronizada. O aprendizado de máquina surge como uma alternativa para completar estas lacunas existentes nos inquéritos com base em características sociodemográficas e preditores relacionados. Este trabalho avalia o desempenho de quatro técnicas de aprendizado de máquina (redes neurais, árvores de decisão, KNN e XGB) nesta tarefa, observando o comportamento de dois desfechos de saúde em quatro amostras diferentes. Os resultados apontam para a existência de uma grande variação no desempenho de acordo com o desfecho selecionado. A disponibilidade dos mesmos indicadores como preditores também é um desafio enfrentado. As técnicas de aprendizado de máquina estudadas apresentaram pouca variação de desempenho entre elas, o que sugere que a natureza dos dados é um fator determinante neste tipo de aplicação. Contudo, o primeiro desfecho apresentou resultados aceitáveis para uma aplicação prática, enquanto o segundo desfecho atingiu estimativas inferiores ao que especialistas consideram como um desempenho razoável.Monitoring the development of countries’ health and nutrition indicators rely on accurate and complete data. Low-and middle-income countries depend on populational surveys for decision-making since their information systems are still unreliable. These indicators are health outcomes which point out the status of a maternal and child health intervention, behavior or care. Despite being great sources of information, the populational surveys also lack information which could prevent the creation of these standardized indicators. Machine learning arise as an alternative to fill the gaps found in the surveys based on sociodemographic characteristics and related predictors. This work evaluates the performance of four machine learning techniques (neural networks, decision trees, KNN and XGB) in this task by observing the behavior of two health outcomes in four different samples. The results indicate that a great variation can be found depending on the selected outcome. The availability of those indicators as predictors is also a challenge. The studied machine learning techniques presented a small performance variation between themselves which suggests that the nature of the data is determinant to this kind of application. Still, the first outcomes showed acceptable results for a practical application while the second outcome reached lower estimates compared to those which specialists consider as a reasonable performance.Sem bolsaporUniversidade Federal de PelotasPrograma de Pós-Graduação em ComputaçãoUFPelBrasilCentro de Desenvolvimento TecnológicoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado de máquinaDesfechos de saúdeInquéritos populacionais de saúdeMachine learningHealth outcomesPopulational health surveysPredição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquinaData prediction in populational surveys using machine learning techniquesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://lattes.cnpq.br/8804473439219857http://lattes.cnpq.br/1544604888519188Fleischmann, Ana Marilza Pernashttp://lattes.cnpq.br/1435405686437314Araújo, Ricardo Matsumura deFerreira, Leonardo Zaniniinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPel - Guaiacainstname:Universidade Federal de Pelotas (UFPEL)instacron:UFPELTEXTDissertacao_Leonardo_Ferreira.pdf.txtDissertacao_Leonardo_Ferreira.pdf.txtExtracted texttext/plain132415http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/6/Dissertacao_Leonardo_Ferreira.pdf.txtebd9a3293f96f86b12db9112117d65f6MD56open accessTHUMBNAILDissertacao_Leonardo_Ferreira.pdf.jpgDissertacao_Leonardo_Ferreira.pdf.jpgGenerated Thumbnailimage/jpeg1206http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/7/Dissertacao_Leonardo_Ferreira.pdf.jpgd944a0dadc4dbc90b5f35af91793349dMD57open accessORIGINALDissertacao_Leonardo_Ferreira.pdfDissertacao_Leonardo_Ferreira.pdfapplication/pdf1173663http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/1/Dissertacao_Leonardo_Ferreira.pdf384c6abb1e58fbe7d32878fbb1484979MD51open accessCC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52open accesslicense_textlicense_texttext/html; charset=utf-80http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53open accesslicense_rdflicense_rdfapplication/rdf+xml; charset=utf-80http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/4/license_rdfd41d8cd98f00b204e9800998ecf8427eMD54open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-81866http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/5/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD55open accessprefix/38482023-07-13 03:07:41.026open accessoai:guaiaca.ufpel.edu.br:prefix/3848TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttp://repositorio.ufpel.edu.br/oai/requestrippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.bropendoar:2023-07-13T06:07:41Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)false |
dc.title.pt_BR.fl_str_mv |
Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina |
dc.title.alternative.pt_BR.fl_str_mv |
Data prediction in populational surveys using machine learning techniques |
title |
Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina |
spellingShingle |
Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina Ferreira, Leonardo Zanini CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Aprendizado de máquina Desfechos de saúde Inquéritos populacionais de saúde Machine learning Health outcomes Populational health surveys |
title_short |
Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina |
title_full |
Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina |
title_fullStr |
Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina |
title_full_unstemmed |
Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina |
title_sort |
Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina |
author |
Ferreira, Leonardo Zanini |
author_facet |
Ferreira, Leonardo Zanini |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/8804473439219857 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1544604888519188 |
dc.contributor.advisor-co2.fl_str_mv |
Fleischmann, Ana Marilza Pernas |
dc.contributor.advisor-co2Lattes.fl_str_mv |
http://lattes.cnpq.br/1435405686437314 |
dc.contributor.advisor1.fl_str_mv |
Araújo, Ricardo Matsumura de |
dc.contributor.author.fl_str_mv |
Ferreira, Leonardo Zanini |
contributor_str_mv |
Fleischmann, Ana Marilza Pernas Araújo, Ricardo Matsumura de |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Aprendizado de máquina Desfechos de saúde Inquéritos populacionais de saúde Machine learning Health outcomes Populational health surveys |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Desfechos de saúde Inquéritos populacionais de saúde Machine learning Health outcomes Populational health surveys |
description |
O monitoramento do desenvolvimento dos indicadores de saúde e nutrição dos países depende de dados precisos e completos. Países de baixa e média renda dependem de inquéritos populacionais para tomada de decisões, já que seus sistemas de informação ainda são precários. Estes indicadores são desfechos de saúde que indicam a situação de uma intervenção, comportamento ou cuidado de saúde materno-infantil. Apesar de serem ótimas fontes de informação, os inquéritos populacionais também possuem informações incompletas que podem inviabilizar a construção destes indicadores de forma padronizada. O aprendizado de máquina surge como uma alternativa para completar estas lacunas existentes nos inquéritos com base em características sociodemográficas e preditores relacionados. Este trabalho avalia o desempenho de quatro técnicas de aprendizado de máquina (redes neurais, árvores de decisão, KNN e XGB) nesta tarefa, observando o comportamento de dois desfechos de saúde em quatro amostras diferentes. Os resultados apontam para a existência de uma grande variação no desempenho de acordo com o desfecho selecionado. A disponibilidade dos mesmos indicadores como preditores também é um desafio enfrentado. As técnicas de aprendizado de máquina estudadas apresentaram pouca variação de desempenho entre elas, o que sugere que a natureza dos dados é um fator determinante neste tipo de aplicação. Contudo, o primeiro desfecho apresentou resultados aceitáveis para uma aplicação prática, enquanto o segundo desfecho atingiu estimativas inferiores ao que especialistas consideram como um desempenho razoável. |
publishDate |
2018 |
dc.date.accessioned.fl_str_mv |
2018-04-19T14:45:34Z |
dc.date.available.fl_str_mv |
2018-04-19T14:45:34Z |
dc.date.issued.fl_str_mv |
2018-02-06 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
FERREIRA, Leonardo Zanini. Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina. 2018. 87 f. Dissertação (Mestrado) – Programa de Pós-Graduação em Computação, Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, 2018. |
dc.identifier.uri.fl_str_mv |
http://repositorio.ufpel.edu.br/handle/prefix/3848 |
identifier_str_mv |
FERREIRA, Leonardo Zanini. Predição de dados em inquéritos populacionais utilizando técnicas de aprendizado de máquina. 2018. 87 f. Dissertação (Mestrado) – Programa de Pós-Graduação em Computação, Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, 2018. |
url |
http://repositorio.ufpel.edu.br/handle/prefix/3848 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pelotas |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Computação |
dc.publisher.initials.fl_str_mv |
UFPel |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Centro de Desenvolvimento Tecnológico |
publisher.none.fl_str_mv |
Universidade Federal de Pelotas |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPel - Guaiaca instname:Universidade Federal de Pelotas (UFPEL) instacron:UFPEL |
instname_str |
Universidade Federal de Pelotas (UFPEL) |
instacron_str |
UFPEL |
institution |
UFPEL |
reponame_str |
Repositório Institucional da UFPel - Guaiaca |
collection |
Repositório Institucional da UFPel - Guaiaca |
bitstream.url.fl_str_mv |
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/6/Dissertacao_Leonardo_Ferreira.pdf.txt http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/7/Dissertacao_Leonardo_Ferreira.pdf.jpg http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/1/Dissertacao_Leonardo_Ferreira.pdf http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/2/license_url http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/3/license_text http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/4/license_rdf http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3848/5/license.txt |
bitstream.checksum.fl_str_mv |
ebd9a3293f96f86b12db9112117d65f6 d944a0dadc4dbc90b5f35af91793349d 384c6abb1e58fbe7d32878fbb1484979 4afdbb8c545fd630ea7db775da747b2f d41d8cd98f00b204e9800998ecf8427e d41d8cd98f00b204e9800998ecf8427e 43cd690d6a359e86c1fe3d5b7cba0c9b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL) |
repository.mail.fl_str_mv |
rippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.br |
_version_ |
1813710075795079168 |