Qualidade de dados através de árvores de decisão

Detalhes bibliográficos
Autor(a) principal: Neves, Guilherme Coelho
Data de Publicação: 2014
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFJF
Texto Completo: https://repositorio.ufjf.br/jspui/handle/ufjf/12237
Resumo: Após a implementação de um programa baseado em redes neurais artificiais para a triagem de pacientes quanto ao diagnóstico de tuberculose em Unidades de Saúde do Brasil, foi identificado que os dados coletados poderiam estar “viesados”. Esta suspeita ocorreu ao comparar os dados e saídas obtidas pela rede neural com o diagnóstico dos médicos. Através de entrevistas e investigações feitas por parte dos responsáveis pelo software implantado, foi identificado que os usuários do programa, muitas vezes pressionados pelas condições de trabalho, poderiam estar alterando os dados de entrada dos pacientes para que obtivessem como possível diagnóstico pela triagem uma alternativa que não a tuberculose. Neste trabalho, é proposta uma metodologia que busca identificar a confiabilidade da informação processada pelo sistema, bem como aplicar técnicas que retardam e desmotivam o preenchimento tendencioso do questionário por parte do usuário. Utilizando de técnicas de agrupamento de dados (árvores de decisão) e de visualização de dados (Análise De Componentes Principais - para dados categóricos -Análise de Correspondência), pretende-se não só qualificar os dados, como também quantificar a confiabilidade dos mesmos.
id UFJF_2c992309140c8b2455bd4d3b787a9b69
oai_identifier_str oai:hermes.cpd.ufjf.br:ufjf/12237
network_acronym_str UFJF
network_name_str Repositório Institucional da UFJF
repository_id_str
spelling Bastos, Ronaldo Rochahttp://lattes.cnpq.br/8943562657054260Bastos, Ronaldo Rochahttp://lattes.cnpq.br/8943562657054260Souza, Augusto Carvalhohttp://lattes.cnpq.br/4948010017164625Faier, José Márciohttp://lattes.cnpq.br/9583349170280272http://lattes.cnpq.br/9588011987118479Neves, Guilherme Coelho2021-01-20T21:54:32Z2021-01-012021-01-20T21:54:32Z2014-02-03https://repositorio.ufjf.br/jspui/handle/ufjf/12237Após a implementação de um programa baseado em redes neurais artificiais para a triagem de pacientes quanto ao diagnóstico de tuberculose em Unidades de Saúde do Brasil, foi identificado que os dados coletados poderiam estar “viesados”. Esta suspeita ocorreu ao comparar os dados e saídas obtidas pela rede neural com o diagnóstico dos médicos. Através de entrevistas e investigações feitas por parte dos responsáveis pelo software implantado, foi identificado que os usuários do programa, muitas vezes pressionados pelas condições de trabalho, poderiam estar alterando os dados de entrada dos pacientes para que obtivessem como possível diagnóstico pela triagem uma alternativa que não a tuberculose. Neste trabalho, é proposta uma metodologia que busca identificar a confiabilidade da informação processada pelo sistema, bem como aplicar técnicas que retardam e desmotivam o preenchimento tendencioso do questionário por parte do usuário. Utilizando de técnicas de agrupamento de dados (árvores de decisão) e de visualização de dados (Análise De Componentes Principais - para dados categóricos -Análise de Correspondência), pretende-se não só qualificar os dados, como também quantificar a confiabilidade dos mesmos.After the implementation of a program based on artificial neural networks for the screening of patients for the diagnosis of tuberculosis in Health Units of the Brazil, it was identified that the data collected could be “biased”. This suspicion occurred when comparing the data and outputs obtained by the neural network with the diagnosis of doctors. Through interviews and investigations by those responsible for the software implemented, it was identified that users of the program, often under pressure by working conditions, they could be altering patient input data so that they could obtain, as a possible diagnosis by screening, an alternative other than tuberculosis. In this work, a methodology is proposed that seeks to identify the reliability of the information processed by the system, as well as applying techniques that delay and demotivate the user's tendentious completion of the questionnaire. Using data grouping techniques (decision trees) and visualization analysis (Principal Component Analysis - for categorical data - Analysis of Correspondence), it is intended not only to qualify the data, but also to quantify the reliability.porUniversidade Federal de Juiz de Fora (UFJF)UFJFBrasilICE – Instituto de Ciências Exatashttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAanálise multivariadaárvores de decisãoqualidade de dadosanálise de correspondênciaTuberculoseanalyze multivariatedecision treesdata qualitycorrespondence analysisTuberculosisQualidade de dados através de árvores de decisãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisreponame:Repositório Institucional da UFJFinstname:Universidade Federal de Juiz de Fora (UFJF)instacron:UFJFCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufjf.br/jspui/bitstream/ufjf/12237/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52ORIGINALguilhermecoelhoneves.pdfguilhermecoelhoneves.pdfGuilherme Coelho Nevesapplication/pdf1874129https://repositorio.ufjf.br/jspui/bitstream/ufjf/12237/4/guilhermecoelhoneves.pdf3e85c0f7c8d8ad1a03cf7505bb227e19MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ufjf.br/jspui/bitstream/ufjf/12237/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD55TEXTguilhermecoelhoneves.pdf.txtguilhermecoelhoneves.pdf.txtExtracted texttext/plain71661https://repositorio.ufjf.br/jspui/bitstream/ufjf/12237/6/guilhermecoelhoneves.pdf.txt554e4459d0225b7c61d8674778419f8cMD56THUMBNAILguilhermecoelhoneves.pdf.jpgguilhermecoelhoneves.pdf.jpgGenerated Thumbnailimage/jpeg1162https://repositorio.ufjf.br/jspui/bitstream/ufjf/12237/7/guilhermecoelhoneves.pdf.jpg5c0ac83fd308719b132f4f960e613054MD57ufjf/122372021-01-21 04:07:54.95oai:hermes.cpd.ufjf.br:ufjf/12237Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufjf.br/oai/requestopendoar:2021-01-21T06:07:54Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)false
dc.title.pt_BR.fl_str_mv Qualidade de dados através de árvores de decisão
title Qualidade de dados através de árvores de decisão
spellingShingle Qualidade de dados através de árvores de decisão
Neves, Guilherme Coelho
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
análise multivariada
árvores de decisão
qualidade de dados
análise de correspondência
Tuberculose
analyze multivariate
decision trees
data quality
correspondence analysis
Tuberculosis
title_short Qualidade de dados através de árvores de decisão
title_full Qualidade de dados através de árvores de decisão
title_fullStr Qualidade de dados através de árvores de decisão
title_full_unstemmed Qualidade de dados através de árvores de decisão
title_sort Qualidade de dados através de árvores de decisão
author Neves, Guilherme Coelho
author_facet Neves, Guilherme Coelho
author_role author
dc.contributor.advisor1.fl_str_mv Bastos, Ronaldo Rocha
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8943562657054260
dc.contributor.referee1.fl_str_mv Bastos, Ronaldo Rocha
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/8943562657054260
dc.contributor.referee2.fl_str_mv Souza, Augusto Carvalho
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/4948010017164625
dc.contributor.referee3.fl_str_mv Faier, José Márcio
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/9583349170280272
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/9588011987118479
dc.contributor.author.fl_str_mv Neves, Guilherme Coelho
contributor_str_mv Bastos, Ronaldo Rocha
Bastos, Ronaldo Rocha
Souza, Augusto Carvalho
Faier, José Márcio
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
topic CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
análise multivariada
árvores de decisão
qualidade de dados
análise de correspondência
Tuberculose
analyze multivariate
decision trees
data quality
correspondence analysis
Tuberculosis
dc.subject.por.fl_str_mv análise multivariada
árvores de decisão
qualidade de dados
análise de correspondência
Tuberculose
analyze multivariate
decision trees
data quality
correspondence analysis
Tuberculosis
description Após a implementação de um programa baseado em redes neurais artificiais para a triagem de pacientes quanto ao diagnóstico de tuberculose em Unidades de Saúde do Brasil, foi identificado que os dados coletados poderiam estar “viesados”. Esta suspeita ocorreu ao comparar os dados e saídas obtidas pela rede neural com o diagnóstico dos médicos. Através de entrevistas e investigações feitas por parte dos responsáveis pelo software implantado, foi identificado que os usuários do programa, muitas vezes pressionados pelas condições de trabalho, poderiam estar alterando os dados de entrada dos pacientes para que obtivessem como possível diagnóstico pela triagem uma alternativa que não a tuberculose. Neste trabalho, é proposta uma metodologia que busca identificar a confiabilidade da informação processada pelo sistema, bem como aplicar técnicas que retardam e desmotivam o preenchimento tendencioso do questionário por parte do usuário. Utilizando de técnicas de agrupamento de dados (árvores de decisão) e de visualização de dados (Análise De Componentes Principais - para dados categóricos -Análise de Correspondência), pretende-se não só qualificar os dados, como também quantificar a confiabilidade dos mesmos.
publishDate 2014
dc.date.issued.fl_str_mv 2014-02-03
dc.date.accessioned.fl_str_mv 2021-01-20T21:54:32Z
dc.date.available.fl_str_mv 2021-01-01
2021-01-20T21:54:32Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufjf.br/jspui/handle/ufjf/12237
url https://repositorio.ufjf.br/jspui/handle/ufjf/12237
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Juiz de Fora (UFJF)
dc.publisher.initials.fl_str_mv UFJF
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv ICE – Instituto de Ciências Exatas
publisher.none.fl_str_mv Universidade Federal de Juiz de Fora (UFJF)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFJF
instname:Universidade Federal de Juiz de Fora (UFJF)
instacron:UFJF
instname_str Universidade Federal de Juiz de Fora (UFJF)
instacron_str UFJF
institution UFJF
reponame_str Repositório Institucional da UFJF
collection Repositório Institucional da UFJF
bitstream.url.fl_str_mv https://repositorio.ufjf.br/jspui/bitstream/ufjf/12237/2/license_rdf
https://repositorio.ufjf.br/jspui/bitstream/ufjf/12237/4/guilhermecoelhoneves.pdf
https://repositorio.ufjf.br/jspui/bitstream/ufjf/12237/5/license.txt
https://repositorio.ufjf.br/jspui/bitstream/ufjf/12237/6/guilhermecoelhoneves.pdf.txt
https://repositorio.ufjf.br/jspui/bitstream/ufjf/12237/7/guilhermecoelhoneves.pdf.jpg
bitstream.checksum.fl_str_mv e39d27027a6cc9cb039ad269a5db8e34
3e85c0f7c8d8ad1a03cf7505bb227e19
8a4605be74aa9ea9d79846c1fba20a33
554e4459d0225b7c61d8674778419f8c
5c0ac83fd308719b132f4f960e613054
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFJF - Universidade Federal de Juiz de Fora (UFJF)
repository.mail.fl_str_mv
_version_ 1801661329317036032