Similaridade em linhas celulares nos sitemas de recomendação farmacológicos para o tratamento oncológico

Bento, Bruno Alexandre Cordeiro

Similaridade em linhas celulares nos sitemas de recomendação farmacológicos para o tratamento oncológico

Detalhes bibliográficos
Autor(a) principal:	Bento, Bruno Alexandre Cordeiro
Data de Publicação:	2023
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo:	http://hdl.handle.net/10400.26/48982
Resumo:	Nas últimas décadas a área da saúde tem-se focado na busca de respostas, cada vez mais personalizadas, para o tratamento das mais variadas patologias. Neste caminho encontra-se o doente oncológico, diferenciando-se dos demais pela complexidade da sua patologia. Neste sentido têm surgido novas disciplinas como: a Bioinformática, a Farmacogenómica, o Machine Learning, o Data Mining, a Genómica, entre outras. A descoberta do sequenciamento genético tem avanços muito significativos nestas áreas, permitindo cada vez mais praticar a chamada medicina de precisão e individualizada para cada doente. Ou seja, cada vez mais o doente é tratado de forma individualizada, com uma determinada patologia, e não um grupo de doentes com características distintas, que detêm a mesma patologia. Será estudada a similaridade entre linhas celulares, tendo por base os Sistemas de Recomendação (RecSys), para o tratamento do doente oncológico. Na implementação deste projeto usar-se-á a metodologia Cross-Industry Standard Process for Data Mining (CRISP DM), onde serão abordadas métricas de similaridade e algoritmos de machine learning, por forma a responder à identificação da similaridade entre linhas celulares. O dataset usado foi o do Genomics of Drug Sensitivity in Cancer (GDSC1), tendo-se selecionado uma amostra de 20 linhas celulares (10 amostras referentes à patologia da mama e 10 amostras referentes a patologias da pele), com 49386 genes cada, dado os recursos de hardware. Para avaliar a similaridade da expressão génica entre estas linhas celulares, serão aplicadas métricas de similaridade, para avaliar 3 genes de uma amostra das 20 linhas celulares, e por outro lado os algoritmos de machine learning onde serão avaliados os 49386 genes de cada amostra das 20 linhas celulares. Assim as métricas de similaridade testadas foram as distâncias de Dice, Jaccard, Sorensen, Czekanowski, Minkowski, Pearson, Intersection, Manhattan, Tanimoto e Euclideana. Na parte dos algoritmos de machine learning foram testados: Rede Neural Artificial, Logistic regression, Linear discriminant analysis, K-Nearest Neighbors, DecisionTreeClassifier, Gaussian NB e Support vector machine. Como conclusão dos resultados obtidos, as distâncias de similaridade com melhores resultados foram Jaccard e Dice, uma vez que apresentaram os resultados mais consistentes para os dois genes selecionados sendo que num dos genes os resultados ainda foram mais consistentes, já os algoritmos que apresentaram uma melhor accuracy foram Logistic Regression, Linear Discriminant Analysis e Gaussian NB.

Metadados do item

id	RCAP_56f9a725752f57671b0a073e5dbd8f33
oai_identifier_str	oai:comum.rcaap.pt:10400.26/48982
network_acronym_str	RCAP
network_name_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str	7160
spelling	Similaridade em linhas celulares nos sitemas de recomendação farmacológicos para o tratamento oncológicoAlgoritmo de similaridadeDistâncias de similaridadeLinha celularTratamento oncológicoSistema de recomendaçãoGDSCDNAMicroarrayMachine learningNas últimas décadas a área da saúde tem-se focado na busca de respostas, cada vez mais personalizadas, para o tratamento das mais variadas patologias. Neste caminho encontra-se o doente oncológico, diferenciando-se dos demais pela complexidade da sua patologia. Neste sentido têm surgido novas disciplinas como: a Bioinformática, a Farmacogenómica, o Machine Learning, o Data Mining, a Genómica, entre outras. A descoberta do sequenciamento genético tem avanços muito significativos nestas áreas, permitindo cada vez mais praticar a chamada medicina de precisão e individualizada para cada doente. Ou seja, cada vez mais o doente é tratado de forma individualizada, com uma determinada patologia, e não um grupo de doentes com características distintas, que detêm a mesma patologia. Será estudada a similaridade entre linhas celulares, tendo por base os Sistemas de Recomendação (RecSys), para o tratamento do doente oncológico. Na implementação deste projeto usar-se-á a metodologia Cross-Industry Standard Process for Data Mining (CRISP DM), onde serão abordadas métricas de similaridade e algoritmos de machine learning, por forma a responder à identificação da similaridade entre linhas celulares. O dataset usado foi o do Genomics of Drug Sensitivity in Cancer (GDSC1), tendo-se selecionado uma amostra de 20 linhas celulares (10 amostras referentes à patologia da mama e 10 amostras referentes a patologias da pele), com 49386 genes cada, dado os recursos de hardware. Para avaliar a similaridade da expressão génica entre estas linhas celulares, serão aplicadas métricas de similaridade, para avaliar 3 genes de uma amostra das 20 linhas celulares, e por outro lado os algoritmos de machine learning onde serão avaliados os 49386 genes de cada amostra das 20 linhas celulares. Assim as métricas de similaridade testadas foram as distâncias de Dice, Jaccard, Sorensen, Czekanowski, Minkowski, Pearson, Intersection, Manhattan, Tanimoto e Euclideana. Na parte dos algoritmos de machine learning foram testados: Rede Neural Artificial, Logistic regression, Linear discriminant analysis, K-Nearest Neighbors, DecisionTreeClassifier, Gaussian NB e Support vector machine. Como conclusão dos resultados obtidos, as distâncias de similaridade com melhores resultados foram Jaccard e Dice, uma vez que apresentaram os resultados mais consistentes para os dois genes selecionados sendo que num dos genes os resultados ainda foram mais consistentes, já os algoritmos que apresentaram uma melhor accuracy foram Logistic Regression, Linear Discriminant Analysis e Gaussian NB.Belfo, Fernando Paulo dos Santos RodriguesRibeiro, António Rui TrigoRepositório ComumBento, Bruno Alexandre Cordeiro2024-01-16T11:05:26Z20232023-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.26/48982TID:203466683porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-01-18T02:16:04Zoai:comum.rcaap.pt:10400.26/48982Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T01:51:55.560704Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv	Similaridade em linhas celulares nos sitemas de recomendação farmacológicos para o tratamento oncológico
title	Similaridade em linhas celulares nos sitemas de recomendação farmacológicos para o tratamento oncológico
spellingShingle	Similaridade em linhas celulares nos sitemas de recomendação farmacológicos para o tratamento oncológico Bento, Bruno Alexandre Cordeiro Algoritmo de similaridade Distâncias de similaridade Linha celular Tratamento oncológico Sistema de recomendação GDSC DNA Microarray Machine learning
title_short	Similaridade em linhas celulares nos sitemas de recomendação farmacológicos para o tratamento oncológico
title_full	Similaridade em linhas celulares nos sitemas de recomendação farmacológicos para o tratamento oncológico
title_fullStr	Similaridade em linhas celulares nos sitemas de recomendação farmacológicos para o tratamento oncológico
title_full_unstemmed	Similaridade em linhas celulares nos sitemas de recomendação farmacológicos para o tratamento oncológico
title_sort	Similaridade em linhas celulares nos sitemas de recomendação farmacológicos para o tratamento oncológico
author	Bento, Bruno Alexandre Cordeiro
author_facet	Bento, Bruno Alexandre Cordeiro
author_role	author
dc.contributor.none.fl_str_mv	Belfo, Fernando Paulo dos Santos Rodrigues Ribeiro, António Rui Trigo Repositório Comum
dc.contributor.author.fl_str_mv	Bento, Bruno Alexandre Cordeiro
dc.subject.por.fl_str_mv	Algoritmo de similaridade Distâncias de similaridade Linha celular Tratamento oncológico Sistema de recomendação GDSC DNA Microarray Machine learning
topic	Algoritmo de similaridade Distâncias de similaridade Linha celular Tratamento oncológico Sistema de recomendação GDSC DNA Microarray Machine learning
description	Nas últimas décadas a área da saúde tem-se focado na busca de respostas, cada vez mais personalizadas, para o tratamento das mais variadas patologias. Neste caminho encontra-se o doente oncológico, diferenciando-se dos demais pela complexidade da sua patologia. Neste sentido têm surgido novas disciplinas como: a Bioinformática, a Farmacogenómica, o Machine Learning, o Data Mining, a Genómica, entre outras. A descoberta do sequenciamento genético tem avanços muito significativos nestas áreas, permitindo cada vez mais praticar a chamada medicina de precisão e individualizada para cada doente. Ou seja, cada vez mais o doente é tratado de forma individualizada, com uma determinada patologia, e não um grupo de doentes com características distintas, que detêm a mesma patologia. Será estudada a similaridade entre linhas celulares, tendo por base os Sistemas de Recomendação (RecSys), para o tratamento do doente oncológico. Na implementação deste projeto usar-se-á a metodologia Cross-Industry Standard Process for Data Mining (CRISP DM), onde serão abordadas métricas de similaridade e algoritmos de machine learning, por forma a responder à identificação da similaridade entre linhas celulares. O dataset usado foi o do Genomics of Drug Sensitivity in Cancer (GDSC1), tendo-se selecionado uma amostra de 20 linhas celulares (10 amostras referentes à patologia da mama e 10 amostras referentes a patologias da pele), com 49386 genes cada, dado os recursos de hardware. Para avaliar a similaridade da expressão génica entre estas linhas celulares, serão aplicadas métricas de similaridade, para avaliar 3 genes de uma amostra das 20 linhas celulares, e por outro lado os algoritmos de machine learning onde serão avaliados os 49386 genes de cada amostra das 20 linhas celulares. Assim as métricas de similaridade testadas foram as distâncias de Dice, Jaccard, Sorensen, Czekanowski, Minkowski, Pearson, Intersection, Manhattan, Tanimoto e Euclideana. Na parte dos algoritmos de machine learning foram testados: Rede Neural Artificial, Logistic regression, Linear discriminant analysis, K-Nearest Neighbors, DecisionTreeClassifier, Gaussian NB e Support vector machine. Como conclusão dos resultados obtidos, as distâncias de similaridade com melhores resultados foram Jaccard e Dice, uma vez que apresentaram os resultados mais consistentes para os dois genes selecionados sendo que num dos genes os resultados ainda foram mais consistentes, já os algoritmos que apresentaram uma melhor accuracy foram Logistic Regression, Linear Discriminant Analysis e Gaussian NB.
publishDate	2023
dc.date.none.fl_str_mv	2023 2023-01-01T00:00:00Z 2024-01-16T11:05:26Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10400.26/48982 TID:203466683
url	http://hdl.handle.net/10400.26/48982
identifier_str_mv	TID:203466683
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP
instname_str	Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str	RCAAP
institution	RCAAP
reponame_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_	1799137010083954688

Similaridade em linhas celulares nos sitemas de recomendação farmacológicos para o tratamento oncológico

Registros relacionados