Modelo preditivo para o risco de readmissão hospitalar

Barroso, João António Araújo

Modelo preditivo para o risco de readmissão hospitalar

Detalhes bibliográficos
Autor(a) principal:	Barroso, João António Araújo
Data de Publicação:	2017
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo:	http://hdl.handle.net/10773/25092
Resumo:	O desenvolvimento deste projeto passou por 4 fases: duas pesquisas preliminares em momentos distintos; construção e avaliação de modelos preditivos; desenvolvimento de uma aplicação web com a solução de um desses modelos. A primeira fase do projeto consistiu numa pesquisa em que o objetivo foi a recolha de um grande número de artigos relacionados com problemáticas no meio hospitalar. Para esta fase dedicou-se cerca de um mês de trabalho. Desta primeira etapa, determinou-se o objetivo do projeto: o desenvolvimento de um modelo preditivo para o risco de readmissão hospitalar. A segunda fase do projeto foi sem dúvida a que mais tempo se despendeu, onde se dedicaram mais de dois meses de trabalho. Para esta fase foi disponibilizada uma base de dados hospitalar real (de vários hospitais) com cerca de um milhão de observações e centenas de variáveis. Esta fase pode ser dividida em várias etapas: numa etapa inicial procurou-se compreender e resolver incoerências através de modificações e transformações da base de dados original; na segunda fase efetuaram-se modificações ao formato de algumas variáveis e criaram-se outras novas variáveis com recurso às variáveis já existentes; na terceira etapa, após finalizadas as transformações à base de dados, selecionaram-se alguns conjuntos de variáveis por ordem de significância; na última fase construiram-se e testaram-se vários modelos random forest com os conjuntos de treino selecionados na etapa anterior. Na a terceira fase, o objetivo englobava selecionar uma tecnologia Machine Learning (ML) para posterior desenvolvimento de uma aplicação web. Assim, procedeu-se a uma nova pesquisa sobre tecnologias ML, nomeadamente o Apache Spark, o H2O, o H2O Sparkling Water, o Microsoft Azure ML e o OpenCPU. Para esta fase, foi dedicado cerca de um mês de trabalho. Após a pesquisa e decisão da tecnologia a utilizar, desenvolveu-se uma aplicação web. Mais uma vez, foi dedicado cerca de um mês de trabalho para se finalizar esta fase. As fases de trabalho do estágio seguiram a ordem temporal acima descrita, contudo foram desenvolvidos outros trabalhos complementares, como por exemplo, a criação de dashboards usando o software Microsoft Power BI. Para além do que foi mencionado, sempre que existiu oportunidade, discutiuse informalmente com trabalhadores desta área (maioritariamente médicos) acerca do tema, de forma a compreender melhor o problema e descobrir a melhor forma de o abordar.

Metadados do item

id	RCAP_2d73331dc4e35d56d1d9856110e44e48
oai_identifier_str	oai:ria.ua.pt:10773/25092
network_acronym_str	RCAP
network_name_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str	7160
spelling	Modelo preditivo para o risco de readmissão hospitalarRandom forestReadmissão hospitalarOpenCPUModelo preditivoO desenvolvimento deste projeto passou por 4 fases: duas pesquisas preliminares em momentos distintos; construção e avaliação de modelos preditivos; desenvolvimento de uma aplicação web com a solução de um desses modelos. A primeira fase do projeto consistiu numa pesquisa em que o objetivo foi a recolha de um grande número de artigos relacionados com problemáticas no meio hospitalar. Para esta fase dedicou-se cerca de um mês de trabalho. Desta primeira etapa, determinou-se o objetivo do projeto: o desenvolvimento de um modelo preditivo para o risco de readmissão hospitalar. A segunda fase do projeto foi sem dúvida a que mais tempo se despendeu, onde se dedicaram mais de dois meses de trabalho. Para esta fase foi disponibilizada uma base de dados hospitalar real (de vários hospitais) com cerca de um milhão de observações e centenas de variáveis. Esta fase pode ser dividida em várias etapas: numa etapa inicial procurou-se compreender e resolver incoerências através de modificações e transformações da base de dados original; na segunda fase efetuaram-se modificações ao formato de algumas variáveis e criaram-se outras novas variáveis com recurso às variáveis já existentes; na terceira etapa, após finalizadas as transformações à base de dados, selecionaram-se alguns conjuntos de variáveis por ordem de significância; na última fase construiram-se e testaram-se vários modelos random forest com os conjuntos de treino selecionados na etapa anterior. Na a terceira fase, o objetivo englobava selecionar uma tecnologia Machine Learning (ML) para posterior desenvolvimento de uma aplicação web. Assim, procedeu-se a uma nova pesquisa sobre tecnologias ML, nomeadamente o Apache Spark, o H2O, o H2O Sparkling Water, o Microsoft Azure ML e o OpenCPU. Para esta fase, foi dedicado cerca de um mês de trabalho. Após a pesquisa e decisão da tecnologia a utilizar, desenvolveu-se uma aplicação web. Mais uma vez, foi dedicado cerca de um mês de trabalho para se finalizar esta fase. As fases de trabalho do estágio seguiram a ordem temporal acima descrita, contudo foram desenvolvidos outros trabalhos complementares, como por exemplo, a criação de dashboards usando o software Microsoft Power BI. Para além do que foi mencionado, sempre que existiu oportunidade, discutiuse informalmente com trabalhadores desta área (maioritariamente médicos) acerca do tema, de forma a compreender melhor o problema e descobrir a melhor forma de o abordar.The development if this project underwent four stages: two preliminary researches within different timeframes; the construction and evaluation of predictive patterns; the development of a web app that ultimately would solve one of those patterns. The first stage of the project consisted on a research whose aim was the collection of several articles related to issues in the hospital environment. This stage took about a month to be completed, and from this the practical aim of the project was determined: the development of a predictive pattern for the risk of hospital’s readmission. The second stage was undoubtedly the most time consuming, with more than two months of work. To this phase a real and from several hospitals’ database was made available, with about one million observations and hundreds of variables. This stage can be divided into four substeps: firstly, it was attempted an understanding and resolution of inconsistencies through modifications and transformations of the original database; in a second phase, modifications were made to the format of some variables and new others created using those already existing as a resource; then, in the aftermath of the second phase, a group of variables were selected according to their degree of relevance; at last, several Random Forest patterns were built and tested together with the training sets previously selected. The third stage’s aim was the selection of a Machine Learning (ML) technology to further development of a web app. Therefore, a new research on ML technology - namely Apache Spark, H2O, H2O Sparkling Water, Microsoft Azure ML and OpenCPU - was promptly made. This research took approximately a month to be completed. As the research and decision on which technology should be used reached its conclusion, the web app was developed. Once again, about a month was the time spent to finalize this phase of the project. The stages of the internship program followed the aforementioned timeframe. However, some other complementary works were developed, for instance the creation of dashboards using Microsoft Power BI. Nonetheless, whenever the opportunity urged, there were informal discussions with employers in this area - mainly doctors - about this issue, in order to better understand the problem and find out the best way to approach it.2019-01-14T13:39:58Z2017-12-15T00:00:00Z2017-12-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/25092porBarroso, João António Araújoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:48:57Zoai:ria.ua.pt:10773/25092Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:58:32.048012Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv	Modelo preditivo para o risco de readmissão hospitalar
title	Modelo preditivo para o risco de readmissão hospitalar
spellingShingle	Modelo preditivo para o risco de readmissão hospitalar Barroso, João António Araújo Random forest Readmissão hospitalar OpenCPU Modelo preditivo
title_short	Modelo preditivo para o risco de readmissão hospitalar
title_full	Modelo preditivo para o risco de readmissão hospitalar
title_fullStr	Modelo preditivo para o risco de readmissão hospitalar
title_full_unstemmed	Modelo preditivo para o risco de readmissão hospitalar
title_sort	Modelo preditivo para o risco de readmissão hospitalar
author	Barroso, João António Araújo
author_facet	Barroso, João António Araújo
author_role	author
dc.contributor.author.fl_str_mv	Barroso, João António Araújo
dc.subject.por.fl_str_mv	Random forest Readmissão hospitalar OpenCPU Modelo preditivo
topic	Random forest Readmissão hospitalar OpenCPU Modelo preditivo
description	O desenvolvimento deste projeto passou por 4 fases: duas pesquisas preliminares em momentos distintos; construção e avaliação de modelos preditivos; desenvolvimento de uma aplicação web com a solução de um desses modelos. A primeira fase do projeto consistiu numa pesquisa em que o objetivo foi a recolha de um grande número de artigos relacionados com problemáticas no meio hospitalar. Para esta fase dedicou-se cerca de um mês de trabalho. Desta primeira etapa, determinou-se o objetivo do projeto: o desenvolvimento de um modelo preditivo para o risco de readmissão hospitalar. A segunda fase do projeto foi sem dúvida a que mais tempo se despendeu, onde se dedicaram mais de dois meses de trabalho. Para esta fase foi disponibilizada uma base de dados hospitalar real (de vários hospitais) com cerca de um milhão de observações e centenas de variáveis. Esta fase pode ser dividida em várias etapas: numa etapa inicial procurou-se compreender e resolver incoerências através de modificações e transformações da base de dados original; na segunda fase efetuaram-se modificações ao formato de algumas variáveis e criaram-se outras novas variáveis com recurso às variáveis já existentes; na terceira etapa, após finalizadas as transformações à base de dados, selecionaram-se alguns conjuntos de variáveis por ordem de significância; na última fase construiram-se e testaram-se vários modelos random forest com os conjuntos de treino selecionados na etapa anterior. Na a terceira fase, o objetivo englobava selecionar uma tecnologia Machine Learning (ML) para posterior desenvolvimento de uma aplicação web. Assim, procedeu-se a uma nova pesquisa sobre tecnologias ML, nomeadamente o Apache Spark, o H2O, o H2O Sparkling Water, o Microsoft Azure ML e o OpenCPU. Para esta fase, foi dedicado cerca de um mês de trabalho. Após a pesquisa e decisão da tecnologia a utilizar, desenvolveu-se uma aplicação web. Mais uma vez, foi dedicado cerca de um mês de trabalho para se finalizar esta fase. As fases de trabalho do estágio seguiram a ordem temporal acima descrita, contudo foram desenvolvidos outros trabalhos complementares, como por exemplo, a criação de dashboards usando o software Microsoft Power BI. Para além do que foi mencionado, sempre que existiu oportunidade, discutiuse informalmente com trabalhadores desta área (maioritariamente médicos) acerca do tema, de forma a compreender melhor o problema e descobrir a melhor forma de o abordar.
publishDate	2017
dc.date.none.fl_str_mv	2017-12-15T00:00:00Z 2017-12-15 2019-01-14T13:39:58Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10773/25092
url	http://hdl.handle.net/10773/25092
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP
instname_str	Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str	RCAAP
institution	RCAAP
reponame_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_	1799137639617527808

Modelo preditivo para o risco de readmissão hospitalar

Registros relacionados