Data mining applied to the Varicocele condition
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.26/36474 |
Resumo: | O sistema de saúde guarda cada vez mais informação dos seus utentes o que dificulta ou até impossibilita a descoberta de novos conhecimentos só com as técnicas usualmente utilizadas, i.e., as tradicionais técnicas estatísticas. De facto, os investigadores clínicos têm sentido uma crescente necessidade em extrair novos conhecimentos para continuadamente contribuir para o melhoramento dos serviços de saúde prestados. Essa necessidade tem vindo a ser colmatada com a aplicação de um processo, chamado “data mining”, que auxilia, através da aplicação de diversas técnicas (i.e., classificação, clustering, associação, etc.), a descoberta de padrões de dados vistos como interessantes, mas ocultados com as tradicionais técnicas estatísticas. A área da infertilidade masculina já começou a aplicar o data mining, por exemplo, através da aplicação da técnica de classificação para prever o sucesso de uma técnica de Procriação Medicamente Assistida. Contudo, o varicocelo - um síndrome anatómico de varizes escrotais caracterizado pela dilatação das veias que drenam o sangue da região dos testículos que em certos casos dá origem à infertilidade - não foi ainda explorado com uma técnica de data mining. A sua prevalência atinge 40% dos homens tratados por infertilidade, sendo que a infertilidade masculina abrange 50% das causas da infertilidade de um casal. A correção do varicocelo pode ser alcançada com um tratamento radiológico chamado embolização, que tem por objetivo desvitalizar as veias dilatadas através da introdução de substâncias terapêuticas na circulação sanguínea. Neste contexto, este trabalho teve os seguintes principais objetivos: i) averiguar o sucesso da correção do varicocelo com a técnica da embolização através da identificação de algum melhoramento na média dos valores dos parâmetros seminais ou das categorias seminais com recurso a técnicas estatísticas inferenciais (i.e. ANOVA e Chi-quadrado); ii) predizer o sucesso da embolização com técnicas de classificação através da aplicação do decision tree do RapidMiner e do algoritmo W-J48; iii) identificar padrões que caracterizam os pacientes embolizados com a técnica de clustering através do algoritmo K-Means e eleger as relações de atributos que ocorrem mais frequentemente através da técnica de associação com o algoritmo FP-Growth. Este processo de análise de dados seguiu a metodologia Cross-Industry Standard Process for Data mining (CRISP-DM) aplicando-a à análise de uma amostra de 293 homens inférteis descritos com 64 atributos que foram submetidos à embolização no Centro Hospitalar e Universitário de Coimbra (CHUC) entre Janeiro de 2007 e Abril de 2016. Os resultados obtidos indicam que a embolização melhora significativamente a média das concentrações de espermatozoides até 12 meses e de suas morfologias até 6 meses depois da embolização (ANOVA p<0.05) o que permite fundamentar o interesse em prever o sucesso desta técnica terapêutica. Sua previsão computarizada com a árvore de decisão do RapidMiner permitiu prever com uma Accuracy e F-measure de 70.59% e uma AUC de 0.750 que a probabilidade condicional de engravidar tendo um homem com uma severidade baixa ou média do varicocelo e uma parceira entre os 24 e 33 anos inclusive é de 70.83%. Também se viu que a frequência relativa, de pacientes com uma concentração de espermatozoides normal 3 meses depois da embolização e uma motilidade progressiva normal destes antes do tratamento, é mais alta em grupos de pacientes que raramente trabalham em ambientes tóxicos. Estes resultados permitem contribuir para as investigações em curso no domínio da infertilidade, assim como nidentificação de medidas que permitem um maior auxílio na descoberta do conhecimento. Nomeadamente, vimos que a aplicação conjunta dos algoritmos de data mining com as técnicas estatísticas inferenciais, assim como a aplicação de diversas técnicas de data mining (i.e., classificação, clustering e associação), potencia a descoberta do conhecimento em dados clínicos. |
id |
RCAP_594624566f12b305d0f01c6db45073ca |
---|---|
oai_identifier_str |
oai:comum.rcaap.pt:10400.26/36474 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Data mining applied to the Varicocele conditionData miningVaricoceloEmbolizaçãoParâmetros seminaisO sistema de saúde guarda cada vez mais informação dos seus utentes o que dificulta ou até impossibilita a descoberta de novos conhecimentos só com as técnicas usualmente utilizadas, i.e., as tradicionais técnicas estatísticas. De facto, os investigadores clínicos têm sentido uma crescente necessidade em extrair novos conhecimentos para continuadamente contribuir para o melhoramento dos serviços de saúde prestados. Essa necessidade tem vindo a ser colmatada com a aplicação de um processo, chamado “data mining”, que auxilia, através da aplicação de diversas técnicas (i.e., classificação, clustering, associação, etc.), a descoberta de padrões de dados vistos como interessantes, mas ocultados com as tradicionais técnicas estatísticas. A área da infertilidade masculina já começou a aplicar o data mining, por exemplo, através da aplicação da técnica de classificação para prever o sucesso de uma técnica de Procriação Medicamente Assistida. Contudo, o varicocelo - um síndrome anatómico de varizes escrotais caracterizado pela dilatação das veias que drenam o sangue da região dos testículos que em certos casos dá origem à infertilidade - não foi ainda explorado com uma técnica de data mining. A sua prevalência atinge 40% dos homens tratados por infertilidade, sendo que a infertilidade masculina abrange 50% das causas da infertilidade de um casal. A correção do varicocelo pode ser alcançada com um tratamento radiológico chamado embolização, que tem por objetivo desvitalizar as veias dilatadas através da introdução de substâncias terapêuticas na circulação sanguínea. Neste contexto, este trabalho teve os seguintes principais objetivos: i) averiguar o sucesso da correção do varicocelo com a técnica da embolização através da identificação de algum melhoramento na média dos valores dos parâmetros seminais ou das categorias seminais com recurso a técnicas estatísticas inferenciais (i.e. ANOVA e Chi-quadrado); ii) predizer o sucesso da embolização com técnicas de classificação através da aplicação do decision tree do RapidMiner e do algoritmo W-J48; iii) identificar padrões que caracterizam os pacientes embolizados com a técnica de clustering através do algoritmo K-Means e eleger as relações de atributos que ocorrem mais frequentemente através da técnica de associação com o algoritmo FP-Growth. Este processo de análise de dados seguiu a metodologia Cross-Industry Standard Process for Data mining (CRISP-DM) aplicando-a à análise de uma amostra de 293 homens inférteis descritos com 64 atributos que foram submetidos à embolização no Centro Hospitalar e Universitário de Coimbra (CHUC) entre Janeiro de 2007 e Abril de 2016. Os resultados obtidos indicam que a embolização melhora significativamente a média das concentrações de espermatozoides até 12 meses e de suas morfologias até 6 meses depois da embolização (ANOVA p<0.05) o que permite fundamentar o interesse em prever o sucesso desta técnica terapêutica. Sua previsão computarizada com a árvore de decisão do RapidMiner permitiu prever com uma Accuracy e F-measure de 70.59% e uma AUC de 0.750 que a probabilidade condicional de engravidar tendo um homem com uma severidade baixa ou média do varicocelo e uma parceira entre os 24 e 33 anos inclusive é de 70.83%. Também se viu que a frequência relativa, de pacientes com uma concentração de espermatozoides normal 3 meses depois da embolização e uma motilidade progressiva normal destes antes do tratamento, é mais alta em grupos de pacientes que raramente trabalham em ambientes tóxicos. Estes resultados permitem contribuir para as investigações em curso no domínio da infertilidade, assim como nidentificação de medidas que permitem um maior auxílio na descoberta do conhecimento. Nomeadamente, vimos que a aplicação conjunta dos algoritmos de data mining com as técnicas estatísticas inferenciais, assim como a aplicação de diversas técnicas de data mining (i.e., classificação, clustering e associação), potencia a descoberta do conhecimento em dados clínicos.Bernardino, Jorge Fernandes RodriguesSousa, Ana PaulaGruenwald, LeRepositório ComumPereira, Judith Santos2021-05-12T14:25:09Z2019-01-172019-12-19T00:00:00Z2019-12-19T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.26/36474enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-09-05T15:41:03Zoai:comum.rcaap.pt:10400.26/36474Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T15:16:50.839850Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Data mining applied to the Varicocele condition |
title |
Data mining applied to the Varicocele condition |
spellingShingle |
Data mining applied to the Varicocele condition Pereira, Judith Santos Data mining Varicocelo Embolização Parâmetros seminais |
title_short |
Data mining applied to the Varicocele condition |
title_full |
Data mining applied to the Varicocele condition |
title_fullStr |
Data mining applied to the Varicocele condition |
title_full_unstemmed |
Data mining applied to the Varicocele condition |
title_sort |
Data mining applied to the Varicocele condition |
author |
Pereira, Judith Santos |
author_facet |
Pereira, Judith Santos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Bernardino, Jorge Fernandes Rodrigues Sousa, Ana Paula Gruenwald, Le Repositório Comum |
dc.contributor.author.fl_str_mv |
Pereira, Judith Santos |
dc.subject.por.fl_str_mv |
Data mining Varicocelo Embolização Parâmetros seminais |
topic |
Data mining Varicocelo Embolização Parâmetros seminais |
description |
O sistema de saúde guarda cada vez mais informação dos seus utentes o que dificulta ou até impossibilita a descoberta de novos conhecimentos só com as técnicas usualmente utilizadas, i.e., as tradicionais técnicas estatísticas. De facto, os investigadores clínicos têm sentido uma crescente necessidade em extrair novos conhecimentos para continuadamente contribuir para o melhoramento dos serviços de saúde prestados. Essa necessidade tem vindo a ser colmatada com a aplicação de um processo, chamado “data mining”, que auxilia, através da aplicação de diversas técnicas (i.e., classificação, clustering, associação, etc.), a descoberta de padrões de dados vistos como interessantes, mas ocultados com as tradicionais técnicas estatísticas. A área da infertilidade masculina já começou a aplicar o data mining, por exemplo, através da aplicação da técnica de classificação para prever o sucesso de uma técnica de Procriação Medicamente Assistida. Contudo, o varicocelo - um síndrome anatómico de varizes escrotais caracterizado pela dilatação das veias que drenam o sangue da região dos testículos que em certos casos dá origem à infertilidade - não foi ainda explorado com uma técnica de data mining. A sua prevalência atinge 40% dos homens tratados por infertilidade, sendo que a infertilidade masculina abrange 50% das causas da infertilidade de um casal. A correção do varicocelo pode ser alcançada com um tratamento radiológico chamado embolização, que tem por objetivo desvitalizar as veias dilatadas através da introdução de substâncias terapêuticas na circulação sanguínea. Neste contexto, este trabalho teve os seguintes principais objetivos: i) averiguar o sucesso da correção do varicocelo com a técnica da embolização através da identificação de algum melhoramento na média dos valores dos parâmetros seminais ou das categorias seminais com recurso a técnicas estatísticas inferenciais (i.e. ANOVA e Chi-quadrado); ii) predizer o sucesso da embolização com técnicas de classificação através da aplicação do decision tree do RapidMiner e do algoritmo W-J48; iii) identificar padrões que caracterizam os pacientes embolizados com a técnica de clustering através do algoritmo K-Means e eleger as relações de atributos que ocorrem mais frequentemente através da técnica de associação com o algoritmo FP-Growth. Este processo de análise de dados seguiu a metodologia Cross-Industry Standard Process for Data mining (CRISP-DM) aplicando-a à análise de uma amostra de 293 homens inférteis descritos com 64 atributos que foram submetidos à embolização no Centro Hospitalar e Universitário de Coimbra (CHUC) entre Janeiro de 2007 e Abril de 2016. Os resultados obtidos indicam que a embolização melhora significativamente a média das concentrações de espermatozoides até 12 meses e de suas morfologias até 6 meses depois da embolização (ANOVA p<0.05) o que permite fundamentar o interesse em prever o sucesso desta técnica terapêutica. Sua previsão computarizada com a árvore de decisão do RapidMiner permitiu prever com uma Accuracy e F-measure de 70.59% e uma AUC de 0.750 que a probabilidade condicional de engravidar tendo um homem com uma severidade baixa ou média do varicocelo e uma parceira entre os 24 e 33 anos inclusive é de 70.83%. Também se viu que a frequência relativa, de pacientes com uma concentração de espermatozoides normal 3 meses depois da embolização e uma motilidade progressiva normal destes antes do tratamento, é mais alta em grupos de pacientes que raramente trabalham em ambientes tóxicos. Estes resultados permitem contribuir para as investigações em curso no domínio da infertilidade, assim como nidentificação de medidas que permitem um maior auxílio na descoberta do conhecimento. Nomeadamente, vimos que a aplicação conjunta dos algoritmos de data mining com as técnicas estatísticas inferenciais, assim como a aplicação de diversas técnicas de data mining (i.e., classificação, clustering e associação), potencia a descoberta do conhecimento em dados clínicos. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-01-17 2019-12-19T00:00:00Z 2019-12-19T00:00:00Z 2021-05-12T14:25:09Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.26/36474 |
url |
http://hdl.handle.net/10400.26/36474 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799130031286386688 |