Anthropometric data analytics: a portuguese case study

Detalhes bibliográficos
Autor(a) principal: Barata, António Pedro Pereira
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/28307
Resumo: Tese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2017
id RCAP_78576c3c96c052ba09b0921a1019dd05
oai_identifier_str oai:repositorio.ul.pt:10451/28307
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Anthropometric data analytics: a portuguese case studyFetopatologiaFetoPrevisãoIdade gestacionalAgrupamentoTeses de mestrado - 2017Domínio/Área Científica::Ciências Naturais::Ciências BiológicasTese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2017Durante o período neonatal, para produzir corretamente um diagnóstico patológico e permitir assim uma reposta adequada, é imperativo realizar uma rigorosa estimação acerca da idade gestacional do feto. Esta previsão é aplicada como ferramenta essencial para o aconselhamento parental de modo a providenciar um plano de cuidados perinatais apropriado. Durante uma autópsia fetal, a idade gestacional é uma variável a ter em consideração, particularmente utilizada aquando de situações de terminação de gravidez medicamente assistida e/ou infanticídios. No nosso caso, foram colecionadas observações representativas da população Portuguesa da região Centro-Sul de Portugal através do procedimento de várias autópsias fetais, provenientes do Hospital de Egas Moniz (CHLO – Centro Hospitalar de Lisboa Ocidental). Desde há vários anos que o sector de fetopatologia deste hospital tem vindo a analisar e avaliar os casos de mortalidade fetal pertencentes à região Centro-Sul de Portugal. Cada caso de autópsia fetal produz um relatório representativo das medidas e pesos associados ao indivíduo em causa, entre outras informações médicas relevantes; após a sua conclusão, cada relatório é arquivado num dossier (organizado cronologicamente). Este tipo de processamento e armazenamento de informação não proporciona um acesso direto nem estruturado aos valores antropométricos específicos previamente registados, derivados de relatórios médicos elaborados durante um ou mais procedimentos de autópsia fetal. Cada relatório arquivado é, então, tido em consideração como independente de todos os outros casos, tornando trabalhoso e demorado qualquer abordagem ao estudo do seu conteúdo. Para enfrentar este desafio primário, foi necessário desenvolver uma base de dados, assim como toda a metodologia relacionada com a inserção de dados na mesma. Neste presente estudo, um banco de dados nada mais é senão um depósito seguro para informação, servindo o propósito de acomodar estruturalmente dados. Foram registados 24 parâmetros fetais para cada caso individual, incluindo idade gestacional e medições de distâncias e pesos de características antropométricas e órgãos, respetivamente. Obtidas de acordo com o protocolo em vigor, segue a exaustiva lista de medições fetais registadas em cada autópsia: idade gestacional, comprimento total, comprimento craniocaudal, perímetro cefálico, perímetro torácico, perímetro abdominal, comprimento de pé, comprimento da mão, comprimento do dedo médio, distância intercomissural, comprimento do filtro, distância entre os cantos internos, distância entre os cantos externos, comprimento da fenda palpebral esquerda, comprimento da fenda palpebral direita, comprimento do pavilhão auricular esquerdo, comprimento do pavilhão auricular direito, peso corporal, peso dos rins, peso do timo, peso do baço, peso do fígado, peso dos pulmões, e peso doas glândulas suprarrenais. Órgãos emparelhados (pulmões, por exemplo) são representados pelo seu peso combinado. Como unidades, são utilizadas semanas (idade gestacional), centímetros (comprimentos e distâncias), e gramas (pesos). Foi gerado código base para produzir programas capazes de criar e interagir com o construto. Após estipular a estrutura da base de dados, todos os processos de inserção e consulta de informação são geridos por algoritmos especificamente engendrados de modo a prevenir a adulteração não propositada dos dados registados. A linguagem de programação adotada foi Python, versão 2.7 devido às suas bibliotecas (notavelmente: SQLite3, NumPy, e SciPy) e por ser uma linguagem multiparadigmática. A estrutura da base de dados é simples, apesar de relacional. É constituída por uma tabela em que linhas e colunas representam, respetivamente, os indivíduos e os valores dos seus parâmetros fetais registados durante a autópsia (incluindo uma chave primária). Assim, cada linha é representativa de um relatório de autópsia fetal, com a sua própria identidade, e medidas e pesos associados. Tal como a nossa base de dados, simples é também o mecanismo de inserção de dados. Todos os relatórios escritos tiveram de ter a sua informação transferida para o formato digital. Para esse efeito, foi desenvolvido um programa de apoio à inserção de dados. Aquando da sua execução, surge uma interface compreensível que solicita iterativamente ao utilizador os valores registados de cada variável de um relatório de autópsia fetal. Assim que todos os campos estejam preenchidos, a informação recolhida é automaticamente inserida na base de dados, simbolizando um indivíduo e os seus respetivos atributos. Uma vez preenchida a base de dados com toda a informação necessária, é possível propor uma análise adequada. Na totalidade, recolhemos a informação referente a 450 fetos entre as 13 e as 42 semanas de idade (gestacional). Para o devido efeito, a manipulação de informação foi executada utilizando objetos abstratos baseados em tabelas de dispersão (Python) e SPSS. Este trabalho procurou abordar a precisão de diferentes parâmetros fetais em termos de estimação da idade gestacional, fazendo uso de técnicas de regressão e análise em componentes principais (ACP). Na computação dos 2 modelos de regressão linear múltipla, foram utilizados algoritmos específicos de retenção de variáveis baseados na análise de variância (estatística-F). Enquanto ACP e regressões múltiplas foram processadas em SPSS, regressões polinomiais foram executadas em Python. Para cada uma das 23 variáveis (referente a todos os parâmetros fetais selecionados com a exceção de idade gestacional), foram calculadas regressões polinomiais de grau k, k ∈ {1, 2, 3, 4, 5}, derivadas de cada conjunto de pares de pontos variável-idade. Para todas as regressões, múltiplas e polinomiais, os valores de R2 (coeficiente de determinação) foram registados com um valor-p significativo contra a hipótese nula de que os coeficientes estimados de cada parâmetro são iguais zero. Os modelos de regressão foram comparados entre si, com base na proporção de variância da variável dependente (idade gestacional) previsível pela(s) variável(eis) independente(s), isto é, o erro associado a cada modelo (soma do quadrado dos resíduos). Tendo sido estabelecido um nível de significância de α = 0.05, cada modelo de regressão linear múltipla foi comparado a cada um dos outros modelos de regressão (polinomial e linear múltipla); modelos polinomiais foram comparados a outros modelos derivados do mesmo tipo de regressão se e só se partilhassem o mesmo grau k. Relativamente à ACP (com um índice de KMO de 0.972 e um valor de significância próximo de 0 para a homocedasticidade), a proporção de variância partilhada entre cada variável (comunalidade) apresentou maior valor para as variáveis comprimento total, comprimento craniocaudal, comprimento do pé. Associativamente, o único componente principal retido (com valor próprio maior ou igual a 1) apresenta valores de correlação maiores entre esses mesmos parâmetros originais (loadings) do que com qualquer outra variável. Podemos colocar a hipótese, então, de que essas variáveis sejam consideradas possíveis marcadores de desenvolvimento (preditores confiáveis de idade gestacional). De acordo com os algoritmos de seleção de variáveis (SPSS) utilizados para a computação de regressões lineares múltiplas, foram criados 2 modelos explicativos de idade gestacional. Estes modelos apresentaram valores de coeficiente de determinação semelhantes (R2 ≈ 0.953), assim como valores de teste Durbin-Watson adequados. As variáveis retidas apresentadas pelos 2 algoritmos foram semelhantes entre si, exceto para as variáveis representativas de comprimentos total e craniocaudal, que se verificaram como sendo mutualmente exclusivas. Em ambos os modelos, as variáveis selecionadas foram, em ordem decrescente de pesos-β: peso corporal (β ≈ 0.393), comprimento do pé (β ≈ 0.347), comprimento total (β ≈ 0.266), comprimento craniocaudal (β ≈ 0.199), pavilhão auricular esquerdo (β ≈ 0.16), peso dos pulmões, e peso das glândulas suprarrenais. Para as últimas duas variáveis mencionadas, o valor absoluto do peso-β foi menor ou igual a 0.1. Através de comparações entre modelos polinomiais foi possível estabelecer um sistema de classificação para variáveis ou grupos de variáveis, indicativa da qualidade de cada variável (associada a um grau de polinómio) em estimar, de acordo com os nossos dados, a idade gestacional. O grupo de variáveis com maior valor para o coeficiente de determinação, para cada grau polinomial, conteve sempre as variáveis comprimento total, comprimento craniocaudal, e comprimento do pé. De entre todas as regressões, comprimentos total, craniocaudal, e do pé estão constantemente presentes nos grupos de melhores previsores de idade gestacional. Mediante o tipo de regressão aplicada, o peso corporal e o comprimento da mão são também variáveis pertencentes à categoria preditiva anterior.Large amounts of information are systematically generated throughout the course of scientific research and progress. In our case, observations representing the Portuguese population within the central-southern region of Portugal were collected throughout various foetal autopsy procedures. Gestational age (GA) and measured distances and weights of numerous anthropometric features and organs, respectively, were recorded per singleton (24 variables in total). This work seeks to elaborate on the accuracy of different foetal parameters in terms of GA estimation, making use of principal component analysis (PCA) and regression techniques. We created a dataset of 450 foetuses, ranging from 13 to 42 weeks of age, to compute both PCA and regression models. Initial exploratory analysis shed light onto which variables are most explanatory in terms of foetal development, and are thus most likely suitable for predictive rolls. We produced clusters of models, based on coefficient of determination values (R2), by comparing the squared sum of residuals between models (significance level α = 0.05). Models comprised of linear combinations of different variables exhibited significantly higher values of R2 (p-value ≤ 0.05) when compared to single variable models. Multiple linear regression models, however, did not exhibit the same statistical significance when compared internally. Across all regression models (both polynomial and multiple linear), crown-heel length (CHL), crown-rump length (CRL), and foot length (FL) are constantly present within the cluster of best predictors of GA. Depending on the type of regression analysis applied, body weight (Body), hand length (HL) also fall onto the same category. Consistent with previously peer-reviewed work, variables such as CHL, CRL, and FL are found to be the most reliable sources of information for estimating developmental age. In cases where such measurements are impossible to obtain, other foetal features can be utilized (although less reliable) such as HL, HC, body weight, and ear length.Couto, Francisco José MoreiraMonteiro, Lucília da Conceição Mourão de Carvalho CáceresRepositório da Universidade de LisboaBarata, António Pedro Pereira2017-07-11T15:08:14Z201720172017-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/28307TID:201853574enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:19:57Zoai:repositorio.ul.pt:10451/28307Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:44:33.231745Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Anthropometric data analytics: a portuguese case study
title Anthropometric data analytics: a portuguese case study
spellingShingle Anthropometric data analytics: a portuguese case study
Barata, António Pedro Pereira
Fetopatologia
Feto
Previsão
Idade gestacional
Agrupamento
Teses de mestrado - 2017
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
title_short Anthropometric data analytics: a portuguese case study
title_full Anthropometric data analytics: a portuguese case study
title_fullStr Anthropometric data analytics: a portuguese case study
title_full_unstemmed Anthropometric data analytics: a portuguese case study
title_sort Anthropometric data analytics: a portuguese case study
author Barata, António Pedro Pereira
author_facet Barata, António Pedro Pereira
author_role author
dc.contributor.none.fl_str_mv Couto, Francisco José Moreira
Monteiro, Lucília da Conceição Mourão de Carvalho Cáceres
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Barata, António Pedro Pereira
dc.subject.por.fl_str_mv Fetopatologia
Feto
Previsão
Idade gestacional
Agrupamento
Teses de mestrado - 2017
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
topic Fetopatologia
Feto
Previsão
Idade gestacional
Agrupamento
Teses de mestrado - 2017
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
description Tese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2017
publishDate 2017
dc.date.none.fl_str_mv 2017-07-11T15:08:14Z
2017
2017
2017-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/28307
TID:201853574
url http://hdl.handle.net/10451/28307
identifier_str_mv TID:201853574
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134366534729728