Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite

Detalhes bibliográficos
Autor(a) principal: Andrietta, Lucas Tassoni
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/10/10135/tde-21092022-081212/
Resumo: Estratégias de acasalamento dirigido são consideradas ferramentas essenciais em programas de melhoramento animal. Com o advento da Seleção Genômica na última década, em associação aos avanços nas técnicas reprodutivas, nota-se diminuição no intervalo de gerações, aumentos na acurácia de predição e na intensidade de seleção, proporcionando expressivo ganho genético para os animais das cadeias produtivas. A fim de se compreender atributos das informações genotípicas e otimizar acasalamentos, objetivou-se neste estudo, por meio da simulação de uma população de bovinos leiteiros, a exploração de diferentes abordagens de extração de atributos de informações genotípicas de indivíduos do rebanho, tendo como objetivo a avaliação do desempenho preditivo ao se empregar tais dados por meio de dois algoritmos de Machine Learning (Random Forests e K-Nearest Neighbours) em 11 cenários propostos referentes ao coeficiente de endogamia (Froh), valor genético, além da proposta de um método de acasalamento. O uso das abordagens propostas de extração de atributos contribuiu para a diminuição dos dados a serem empregados nos modelos em até 98%, implicando na maioria dos cenários, em resultados mais representativos quando consideradas as informações reduzidas em dimensão quando comparadas a utilização de dados íntegros. Destacou-se o uso do algoritmo Random Forests para os cenários de regressão propostos, em especial na predição dos valores de Froh utilizando os genótipos dos pais em comparação a informação do próprio indivíduo, sendo o resultado de r2 do primeiro superior em 29%, quando utilizado o método de distância euclidiana proposto. Destaca-se também a abordagem visual proposta, favorecendo o desenvolvimento de estudos em busca de indivíduos a serem acasalados de acordo com os interesses relacionados a uniformidade de rebanho e a potenciais expoentes no quesito reprodução.
id USP_384fc2c1216d5691c108740e2fec989c
oai_identifier_str oai:teses.usp.br:tde-21092022-081212
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leiteApplications of machine learning and genomic data to improve economic traits in dairy cattleAcasalamento dirigidoAnimal breedingAprendizado de máquinaMachine learningMating schemeMelhoramento animalEstratégias de acasalamento dirigido são consideradas ferramentas essenciais em programas de melhoramento animal. Com o advento da Seleção Genômica na última década, em associação aos avanços nas técnicas reprodutivas, nota-se diminuição no intervalo de gerações, aumentos na acurácia de predição e na intensidade de seleção, proporcionando expressivo ganho genético para os animais das cadeias produtivas. A fim de se compreender atributos das informações genotípicas e otimizar acasalamentos, objetivou-se neste estudo, por meio da simulação de uma população de bovinos leiteiros, a exploração de diferentes abordagens de extração de atributos de informações genotípicas de indivíduos do rebanho, tendo como objetivo a avaliação do desempenho preditivo ao se empregar tais dados por meio de dois algoritmos de Machine Learning (Random Forests e K-Nearest Neighbours) em 11 cenários propostos referentes ao coeficiente de endogamia (Froh), valor genético, além da proposta de um método de acasalamento. O uso das abordagens propostas de extração de atributos contribuiu para a diminuição dos dados a serem empregados nos modelos em até 98%, implicando na maioria dos cenários, em resultados mais representativos quando consideradas as informações reduzidas em dimensão quando comparadas a utilização de dados íntegros. Destacou-se o uso do algoritmo Random Forests para os cenários de regressão propostos, em especial na predição dos valores de Froh utilizando os genótipos dos pais em comparação a informação do próprio indivíduo, sendo o resultado de r2 do primeiro superior em 29%, quando utilizado o método de distância euclidiana proposto. Destaca-se também a abordagem visual proposta, favorecendo o desenvolvimento de estudos em busca de indivíduos a serem acasalados de acordo com os interesses relacionados a uniformidade de rebanho e a potenciais expoentes no quesito reprodução.Mating strategies are considered essential tools on animal breeding programs, playing an important role to achieve genetic progress. The advent of Genomic Selection in the last decade, in addition to the improvements on reproduction techniques, shortened the generation interval, enhanced breeding values prediction reliabilities and selection intensity, which provided an expressive genetic gain across several industries. In order to understand attributes of genotypic information and optimize matings, the objective of this study, through the simulation of a dairy cattle population, was to explore different approaches to extract attributes of genotypic information from individuals in the herd, with the objective of the evaluation of the predictive performance when using such data through two Machine Learning algorithms (Random Forests and K-Nearest Neighbors) in 11 proposed scenarios referring to the inbreeding coefficient (Froh), genetic value, in addition to the proposal of a mating strategy. The use of the proposed feature extraction methods contributed to the reduction of data by up to 98%, implying in most scenarios, in lower costs and better results when compared to the use of raw data. The Random Forests algorithm for the proposed regression scenarios showed the better results, especially in the prediction of Froh values using the genotypes of the sire and dam in comparison with the of the individual and its own information, with the result of r2 of the former being superior by 29%, when using the proposed Euclidean distance method. Also noteworthy is the proposed visual approach, favoring the development of studies in search of individuals to be mated according to the interests related to herd uniformity and potential exponents in reproduction.Biblioteca Digitais de Teses e Dissertações da USPVentura, Ricardo VieiraAndrietta, Lucas Tassoni2022-07-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/10/10135/tde-21092022-081212/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-10-27T15:00:26Zoai:teses.usp.br:tde-21092022-081212Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-10-27T15:00:26Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite
Applications of machine learning and genomic data to improve economic traits in dairy cattle
title Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite
spellingShingle Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite
Andrietta, Lucas Tassoni
Acasalamento dirigido
Animal breeding
Aprendizado de máquina
Machine learning
Mating scheme
Melhoramento animal
title_short Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite
title_full Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite
title_fullStr Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite
title_full_unstemmed Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite
title_sort Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite
author Andrietta, Lucas Tassoni
author_facet Andrietta, Lucas Tassoni
author_role author
dc.contributor.none.fl_str_mv Ventura, Ricardo Vieira
dc.contributor.author.fl_str_mv Andrietta, Lucas Tassoni
dc.subject.por.fl_str_mv Acasalamento dirigido
Animal breeding
Aprendizado de máquina
Machine learning
Mating scheme
Melhoramento animal
topic Acasalamento dirigido
Animal breeding
Aprendizado de máquina
Machine learning
Mating scheme
Melhoramento animal
description Estratégias de acasalamento dirigido são consideradas ferramentas essenciais em programas de melhoramento animal. Com o advento da Seleção Genômica na última década, em associação aos avanços nas técnicas reprodutivas, nota-se diminuição no intervalo de gerações, aumentos na acurácia de predição e na intensidade de seleção, proporcionando expressivo ganho genético para os animais das cadeias produtivas. A fim de se compreender atributos das informações genotípicas e otimizar acasalamentos, objetivou-se neste estudo, por meio da simulação de uma população de bovinos leiteiros, a exploração de diferentes abordagens de extração de atributos de informações genotípicas de indivíduos do rebanho, tendo como objetivo a avaliação do desempenho preditivo ao se empregar tais dados por meio de dois algoritmos de Machine Learning (Random Forests e K-Nearest Neighbours) em 11 cenários propostos referentes ao coeficiente de endogamia (Froh), valor genético, além da proposta de um método de acasalamento. O uso das abordagens propostas de extração de atributos contribuiu para a diminuição dos dados a serem empregados nos modelos em até 98%, implicando na maioria dos cenários, em resultados mais representativos quando consideradas as informações reduzidas em dimensão quando comparadas a utilização de dados íntegros. Destacou-se o uso do algoritmo Random Forests para os cenários de regressão propostos, em especial na predição dos valores de Froh utilizando os genótipos dos pais em comparação a informação do próprio indivíduo, sendo o resultado de r2 do primeiro superior em 29%, quando utilizado o método de distância euclidiana proposto. Destaca-se também a abordagem visual proposta, favorecendo o desenvolvimento de estudos em busca de indivíduos a serem acasalados de acordo com os interesses relacionados a uniformidade de rebanho e a potenciais expoentes no quesito reprodução.
publishDate 2022
dc.date.none.fl_str_mv 2022-07-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/10/10135/tde-21092022-081212/
url https://www.teses.usp.br/teses/disponiveis/10/10135/tde-21092022-081212/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090967595122688