Modelo de data mining para deteção de embolias pulmonares

Detalhes bibliográficos
Autor(a) principal: Ramalho, Virgínia Valente
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.21/3318
Resumo: Trabalho de Projeto para obtenção do grau de Mestre em Engenharia Informática e de Computadores
id RCAP_e3489d42a1b33d7ed5dc6ef322db8c44
oai_identifier_str oai:repositorio.ipl.pt:10400.21/3318
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Modelo de data mining para deteção de embolias pulmonaresEmbolia pulmonarTomografia computorizadaClassificaçãoPulmonary embolismComputed tomographyKDD Cup 2006Data miningFeature selectionSupport vector machinesClassificationTrabalho de Projeto para obtenção do grau de Mestre em Engenharia Informática e de ComputadoresEste trabalho surge na sequência de um desafio proposto no KDD Cup 2006, detetar a presença de embolia pulmonar a partir de imagens médicas. A embolia pulmonar é o bloqueio da artéria pulmonar ou de um de seus ramos. A rapidez no diagnóstico e tratamento de doentes com embolia pulmonar aguda permite reduzir a sua mortalidade. O desafio clínico, num cenário de emergência, é diagnosticar corretamente o indivíduo que apresenta a patologia, para se dar início ao tratamento. É neste ponto que técnicas de Data Mining podem ser usadas para produzir modelos que auxiliam o médico, radiologista, a tomar decisões. Este trabalho tem como objetivo apresentar modelos de classificação que tenham baixos rácios de falsos positivos na identificação de embolias pulmonares num indivíduo, mas apresentando valores altos de sensibilidade. Foi criado um conjunto de dados, dividido em conjuntos de treino e de teste, que resultam da aplicação de técnicas de Feature Selection e de equilíbrio entre os números de casos de cada classe. Cada par foi utilizado em diferentes algoritmos de classificação. A cada combinação, conjunto de dados e algoritmo, foram aplicadas técnicas de pós-processamento, nomeadamente a alteração do ponto operacional, permitindo alterar as classificações produzidas. A avaliação dos resultados foi obtida através de métricas próprias do domínio do problema, métricas comuns em avaliação de algoritmos de classificação e uma métrica combinada produzida no âmbito deste trabalho. Verifica-se que o algoritmo nu-svm com o tipo kernel radial pode produzir excelentes resultados perante este conjunto de dados.Abstract: This work follows the challenge proposed in KDD Cup 2006, for detecting the presence of pulmonary embolism from medical images. A Pulmonary embolism is a blockage of the pulmonary artery or one of its branches. Its rapid diagnosis and treatment can reduce the mortality associated with this disease. The clinical challenge in an emergency setting, is to quickly diagnose the embolism, so the treatment can start. This is where data mining techniques can be used to produce models that help radiologists with their decisions. The goal of this paper is to present classification models that have low false positive ratios, but are high sensitive to detect pulmonary embolism in the patients. During the development process, several data sets were created, divided in pairs of training and testing data, resulting from the application of Feature Selection techniques and balance between the numbers of cases of each class. Each pair was used with different classification algorithms, normally used in this domain. For each combination of algorithm and dataset, some post-processing techniques are used, including changing the operational point of the classifiers. The evaluation use domain metrics, common metrics for classifiers evaluation and a combined metric produced for this work. The algorithm nu-kernel SVM with radial type, if correctly parameterized , can produce excellent results against this data set. Models that have produced the best results for this data set were implemented with this algorithm.Instituto Superior de Engenharia de LisboaPato, Matilde Pós-de-MinaDatia, Nuno Miguel SoaresRCIPLRamalho, Virgínia Valente2014-03-05T18:00:59Z2013-092013-09-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.21/3318TID:201227410porRAMALHO, Virgínia Valente - Modelo de data mining para deteção de embolias pulmonares. Lisboa: Instituto Superior de Engenharia de Lisboa, 2013. Dissertação de mestrado.info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-08-03T09:43:46Zoai:repositorio.ipl.pt:10400.21/3318Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:12:56.664018Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Modelo de data mining para deteção de embolias pulmonares
title Modelo de data mining para deteção de embolias pulmonares
spellingShingle Modelo de data mining para deteção de embolias pulmonares
Ramalho, Virgínia Valente
Embolia pulmonar
Tomografia computorizada
Classificação
Pulmonary embolism
Computed tomography
KDD Cup 2006
Data mining
Feature selection
Support vector machines
Classification
title_short Modelo de data mining para deteção de embolias pulmonares
title_full Modelo de data mining para deteção de embolias pulmonares
title_fullStr Modelo de data mining para deteção de embolias pulmonares
title_full_unstemmed Modelo de data mining para deteção de embolias pulmonares
title_sort Modelo de data mining para deteção de embolias pulmonares
author Ramalho, Virgínia Valente
author_facet Ramalho, Virgínia Valente
author_role author
dc.contributor.none.fl_str_mv Pato, Matilde Pós-de-Mina
Datia, Nuno Miguel Soares
RCIPL
dc.contributor.author.fl_str_mv Ramalho, Virgínia Valente
dc.subject.por.fl_str_mv Embolia pulmonar
Tomografia computorizada
Classificação
Pulmonary embolism
Computed tomography
KDD Cup 2006
Data mining
Feature selection
Support vector machines
Classification
topic Embolia pulmonar
Tomografia computorizada
Classificação
Pulmonary embolism
Computed tomography
KDD Cup 2006
Data mining
Feature selection
Support vector machines
Classification
description Trabalho de Projeto para obtenção do grau de Mestre em Engenharia Informática e de Computadores
publishDate 2013
dc.date.none.fl_str_mv 2013-09
2013-09-01T00:00:00Z
2014-03-05T18:00:59Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.21/3318
TID:201227410
url http://hdl.handle.net/10400.21/3318
identifier_str_mv TID:201227410
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv RAMALHO, Virgínia Valente - Modelo de data mining para deteção de embolias pulmonares. Lisboa: Instituto Superior de Engenharia de Lisboa, 2013. Dissertação de mestrado.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Instituto Superior de Engenharia de Lisboa
publisher.none.fl_str_mv Instituto Superior de Engenharia de Lisboa
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133385436692480