Modelo preditivo para o risco de readmissão hospitalar

Detalhes bibliográficos
Autor(a) principal: Barroso, João António Araújo
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10773/25092
Resumo: O desenvolvimento deste projeto passou por 4 fases: duas pesquisas preliminares em momentos distintos; construção e avaliação de modelos preditivos; desenvolvimento de uma aplicação web com a solução de um desses modelos. A primeira fase do projeto consistiu numa pesquisa em que o objetivo foi a recolha de um grande número de artigos relacionados com problemáticas no meio hospitalar. Para esta fase dedicou-se cerca de um mês de trabalho. Desta primeira etapa, determinou-se o objetivo do projeto: o desenvolvimento de um modelo preditivo para o risco de readmissão hospitalar. A segunda fase do projeto foi sem dúvida a que mais tempo se despendeu, onde se dedicaram mais de dois meses de trabalho. Para esta fase foi disponibilizada uma base de dados hospitalar real (de vários hospitais) com cerca de um milhão de observações e centenas de variáveis. Esta fase pode ser dividida em várias etapas: numa etapa inicial procurou-se compreender e resolver incoerências através de modificações e transformações da base de dados original; na segunda fase efetuaram-se modificações ao formato de algumas variáveis e criaram-se outras novas variáveis com recurso às variáveis já existentes; na terceira etapa, após finalizadas as transformações à base de dados, selecionaram-se alguns conjuntos de variáveis por ordem de significância; na última fase construiram-se e testaram-se vários modelos random forest com os conjuntos de treino selecionados na etapa anterior. Na a terceira fase, o objetivo englobava selecionar uma tecnologia Machine Learning (ML) para posterior desenvolvimento de uma aplicação web. Assim, procedeu-se a uma nova pesquisa sobre tecnologias ML, nomeadamente o Apache Spark, o H2O, o H2O Sparkling Water, o Microsoft Azure ML e o OpenCPU. Para esta fase, foi dedicado cerca de um mês de trabalho. Após a pesquisa e decisão da tecnologia a utilizar, desenvolveu-se uma aplicação web. Mais uma vez, foi dedicado cerca de um mês de trabalho para se finalizar esta fase. As fases de trabalho do estágio seguiram a ordem temporal acima descrita, contudo foram desenvolvidos outros trabalhos complementares, como por exemplo, a criação de dashboards usando o software Microsoft Power BI. Para além do que foi mencionado, sempre que existiu oportunidade, discutiuse informalmente com trabalhadores desta área (maioritariamente médicos) acerca do tema, de forma a compreender melhor o problema e descobrir a melhor forma de o abordar.
id RCAP_2d73331dc4e35d56d1d9856110e44e48
oai_identifier_str oai:ria.ua.pt:10773/25092
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Modelo preditivo para o risco de readmissão hospitalarRandom forestReadmissão hospitalarOpenCPUModelo preditivoO desenvolvimento deste projeto passou por 4 fases: duas pesquisas preliminares em momentos distintos; construção e avaliação de modelos preditivos; desenvolvimento de uma aplicação web com a solução de um desses modelos. A primeira fase do projeto consistiu numa pesquisa em que o objetivo foi a recolha de um grande número de artigos relacionados com problemáticas no meio hospitalar. Para esta fase dedicou-se cerca de um mês de trabalho. Desta primeira etapa, determinou-se o objetivo do projeto: o desenvolvimento de um modelo preditivo para o risco de readmissão hospitalar. A segunda fase do projeto foi sem dúvida a que mais tempo se despendeu, onde se dedicaram mais de dois meses de trabalho. Para esta fase foi disponibilizada uma base de dados hospitalar real (de vários hospitais) com cerca de um milhão de observações e centenas de variáveis. Esta fase pode ser dividida em várias etapas: numa etapa inicial procurou-se compreender e resolver incoerências através de modificações e transformações da base de dados original; na segunda fase efetuaram-se modificações ao formato de algumas variáveis e criaram-se outras novas variáveis com recurso às variáveis já existentes; na terceira etapa, após finalizadas as transformações à base de dados, selecionaram-se alguns conjuntos de variáveis por ordem de significância; na última fase construiram-se e testaram-se vários modelos random forest com os conjuntos de treino selecionados na etapa anterior. Na a terceira fase, o objetivo englobava selecionar uma tecnologia Machine Learning (ML) para posterior desenvolvimento de uma aplicação web. Assim, procedeu-se a uma nova pesquisa sobre tecnologias ML, nomeadamente o Apache Spark, o H2O, o H2O Sparkling Water, o Microsoft Azure ML e o OpenCPU. Para esta fase, foi dedicado cerca de um mês de trabalho. Após a pesquisa e decisão da tecnologia a utilizar, desenvolveu-se uma aplicação web. Mais uma vez, foi dedicado cerca de um mês de trabalho para se finalizar esta fase. As fases de trabalho do estágio seguiram a ordem temporal acima descrita, contudo foram desenvolvidos outros trabalhos complementares, como por exemplo, a criação de dashboards usando o software Microsoft Power BI. Para além do que foi mencionado, sempre que existiu oportunidade, discutiuse informalmente com trabalhadores desta área (maioritariamente médicos) acerca do tema, de forma a compreender melhor o problema e descobrir a melhor forma de o abordar.The development if this project underwent four stages: two preliminary researches within different timeframes; the construction and evaluation of predictive patterns; the development of a web app that ultimately would solve one of those patterns. The first stage of the project consisted on a research whose aim was the collection of several articles related to issues in the hospital environment. This stage took about a month to be completed, and from this the practical aim of the project was determined: the development of a predictive pattern for the risk of hospital’s readmission. The second stage was undoubtedly the most time consuming, with more than two months of work. To this phase a real and from several hospitals’ database was made available, with about one million observations and hundreds of variables. This stage can be divided into four substeps: firstly, it was attempted an understanding and resolution of inconsistencies through modifications and transformations of the original database; in a second phase, modifications were made to the format of some variables and new others created using those already existing as a resource; then, in the aftermath of the second phase, a group of variables were selected according to their degree of relevance; at last, several Random Forest patterns were built and tested together with the training sets previously selected. The third stage’s aim was the selection of a Machine Learning (ML) technology to further development of a web app. Therefore, a new research on ML technology - namely Apache Spark, H2O, H2O Sparkling Water, Microsoft Azure ML and OpenCPU - was promptly made. This research took approximately a month to be completed. As the research and decision on which technology should be used reached its conclusion, the web app was developed. Once again, about a month was the time spent to finalize this phase of the project. The stages of the internship program followed the aforementioned timeframe. However, some other complementary works were developed, for instance the creation of dashboards using Microsoft Power BI. Nonetheless, whenever the opportunity urged, there were informal discussions with employers in this area - mainly doctors - about this issue, in order to better understand the problem and find out the best way to approach it.2019-01-14T13:39:58Z2017-12-15T00:00:00Z2017-12-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/25092porBarroso, João António Araújoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:48:57Zoai:ria.ua.pt:10773/25092Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:58:32.048012Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Modelo preditivo para o risco de readmissão hospitalar
title Modelo preditivo para o risco de readmissão hospitalar
spellingShingle Modelo preditivo para o risco de readmissão hospitalar
Barroso, João António Araújo
Random forest
Readmissão hospitalar
OpenCPU
Modelo preditivo
title_short Modelo preditivo para o risco de readmissão hospitalar
title_full Modelo preditivo para o risco de readmissão hospitalar
title_fullStr Modelo preditivo para o risco de readmissão hospitalar
title_full_unstemmed Modelo preditivo para o risco de readmissão hospitalar
title_sort Modelo preditivo para o risco de readmissão hospitalar
author Barroso, João António Araújo
author_facet Barroso, João António Araújo
author_role author
dc.contributor.author.fl_str_mv Barroso, João António Araújo
dc.subject.por.fl_str_mv Random forest
Readmissão hospitalar
OpenCPU
Modelo preditivo
topic Random forest
Readmissão hospitalar
OpenCPU
Modelo preditivo
description O desenvolvimento deste projeto passou por 4 fases: duas pesquisas preliminares em momentos distintos; construção e avaliação de modelos preditivos; desenvolvimento de uma aplicação web com a solução de um desses modelos. A primeira fase do projeto consistiu numa pesquisa em que o objetivo foi a recolha de um grande número de artigos relacionados com problemáticas no meio hospitalar. Para esta fase dedicou-se cerca de um mês de trabalho. Desta primeira etapa, determinou-se o objetivo do projeto: o desenvolvimento de um modelo preditivo para o risco de readmissão hospitalar. A segunda fase do projeto foi sem dúvida a que mais tempo se despendeu, onde se dedicaram mais de dois meses de trabalho. Para esta fase foi disponibilizada uma base de dados hospitalar real (de vários hospitais) com cerca de um milhão de observações e centenas de variáveis. Esta fase pode ser dividida em várias etapas: numa etapa inicial procurou-se compreender e resolver incoerências através de modificações e transformações da base de dados original; na segunda fase efetuaram-se modificações ao formato de algumas variáveis e criaram-se outras novas variáveis com recurso às variáveis já existentes; na terceira etapa, após finalizadas as transformações à base de dados, selecionaram-se alguns conjuntos de variáveis por ordem de significância; na última fase construiram-se e testaram-se vários modelos random forest com os conjuntos de treino selecionados na etapa anterior. Na a terceira fase, o objetivo englobava selecionar uma tecnologia Machine Learning (ML) para posterior desenvolvimento de uma aplicação web. Assim, procedeu-se a uma nova pesquisa sobre tecnologias ML, nomeadamente o Apache Spark, o H2O, o H2O Sparkling Water, o Microsoft Azure ML e o OpenCPU. Para esta fase, foi dedicado cerca de um mês de trabalho. Após a pesquisa e decisão da tecnologia a utilizar, desenvolveu-se uma aplicação web. Mais uma vez, foi dedicado cerca de um mês de trabalho para se finalizar esta fase. As fases de trabalho do estágio seguiram a ordem temporal acima descrita, contudo foram desenvolvidos outros trabalhos complementares, como por exemplo, a criação de dashboards usando o software Microsoft Power BI. Para além do que foi mencionado, sempre que existiu oportunidade, discutiuse informalmente com trabalhadores desta área (maioritariamente médicos) acerca do tema, de forma a compreender melhor o problema e descobrir a melhor forma de o abordar.
publishDate 2017
dc.date.none.fl_str_mv 2017-12-15T00:00:00Z
2017-12-15
2019-01-14T13:39:58Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10773/25092
url http://hdl.handle.net/10773/25092
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137639617527808