Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/10/10135/tde-21092022-081212/ |
Resumo: | Estratégias de acasalamento dirigido são consideradas ferramentas essenciais em programas de melhoramento animal. Com o advento da Seleção Genômica na última década, em associação aos avanços nas técnicas reprodutivas, nota-se diminuição no intervalo de gerações, aumentos na acurácia de predição e na intensidade de seleção, proporcionando expressivo ganho genético para os animais das cadeias produtivas. A fim de se compreender atributos das informações genotípicas e otimizar acasalamentos, objetivou-se neste estudo, por meio da simulação de uma população de bovinos leiteiros, a exploração de diferentes abordagens de extração de atributos de informações genotípicas de indivíduos do rebanho, tendo como objetivo a avaliação do desempenho preditivo ao se empregar tais dados por meio de dois algoritmos de Machine Learning (Random Forests e K-Nearest Neighbours) em 11 cenários propostos referentes ao coeficiente de endogamia (Froh), valor genético, além da proposta de um método de acasalamento. O uso das abordagens propostas de extração de atributos contribuiu para a diminuição dos dados a serem empregados nos modelos em até 98%, implicando na maioria dos cenários, em resultados mais representativos quando consideradas as informações reduzidas em dimensão quando comparadas a utilização de dados íntegros. Destacou-se o uso do algoritmo Random Forests para os cenários de regressão propostos, em especial na predição dos valores de Froh utilizando os genótipos dos pais em comparação a informação do próprio indivíduo, sendo o resultado de r2 do primeiro superior em 29%, quando utilizado o método de distância euclidiana proposto. Destaca-se também a abordagem visual proposta, favorecendo o desenvolvimento de estudos em busca de indivíduos a serem acasalados de acordo com os interesses relacionados a uniformidade de rebanho e a potenciais expoentes no quesito reprodução. |
id |
USP_384fc2c1216d5691c108740e2fec989c |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-21092022-081212 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leiteApplications of machine learning and genomic data to improve economic traits in dairy cattleAcasalamento dirigidoAnimal breedingAprendizado de máquinaMachine learningMating schemeMelhoramento animalEstratégias de acasalamento dirigido são consideradas ferramentas essenciais em programas de melhoramento animal. Com o advento da Seleção Genômica na última década, em associação aos avanços nas técnicas reprodutivas, nota-se diminuição no intervalo de gerações, aumentos na acurácia de predição e na intensidade de seleção, proporcionando expressivo ganho genético para os animais das cadeias produtivas. A fim de se compreender atributos das informações genotípicas e otimizar acasalamentos, objetivou-se neste estudo, por meio da simulação de uma população de bovinos leiteiros, a exploração de diferentes abordagens de extração de atributos de informações genotípicas de indivíduos do rebanho, tendo como objetivo a avaliação do desempenho preditivo ao se empregar tais dados por meio de dois algoritmos de Machine Learning (Random Forests e K-Nearest Neighbours) em 11 cenários propostos referentes ao coeficiente de endogamia (Froh), valor genético, além da proposta de um método de acasalamento. O uso das abordagens propostas de extração de atributos contribuiu para a diminuição dos dados a serem empregados nos modelos em até 98%, implicando na maioria dos cenários, em resultados mais representativos quando consideradas as informações reduzidas em dimensão quando comparadas a utilização de dados íntegros. Destacou-se o uso do algoritmo Random Forests para os cenários de regressão propostos, em especial na predição dos valores de Froh utilizando os genótipos dos pais em comparação a informação do próprio indivíduo, sendo o resultado de r2 do primeiro superior em 29%, quando utilizado o método de distância euclidiana proposto. Destaca-se também a abordagem visual proposta, favorecendo o desenvolvimento de estudos em busca de indivíduos a serem acasalados de acordo com os interesses relacionados a uniformidade de rebanho e a potenciais expoentes no quesito reprodução.Mating strategies are considered essential tools on animal breeding programs, playing an important role to achieve genetic progress. The advent of Genomic Selection in the last decade, in addition to the improvements on reproduction techniques, shortened the generation interval, enhanced breeding values prediction reliabilities and selection intensity, which provided an expressive genetic gain across several industries. In order to understand attributes of genotypic information and optimize matings, the objective of this study, through the simulation of a dairy cattle population, was to explore different approaches to extract attributes of genotypic information from individuals in the herd, with the objective of the evaluation of the predictive performance when using such data through two Machine Learning algorithms (Random Forests and K-Nearest Neighbors) in 11 proposed scenarios referring to the inbreeding coefficient (Froh), genetic value, in addition to the proposal of a mating strategy. The use of the proposed feature extraction methods contributed to the reduction of data by up to 98%, implying in most scenarios, in lower costs and better results when compared to the use of raw data. The Random Forests algorithm for the proposed regression scenarios showed the better results, especially in the prediction of Froh values using the genotypes of the sire and dam in comparison with the of the individual and its own information, with the result of r2 of the former being superior by 29%, when using the proposed Euclidean distance method. Also noteworthy is the proposed visual approach, favoring the development of studies in search of individuals to be mated according to the interests related to herd uniformity and potential exponents in reproduction.Biblioteca Digitais de Teses e Dissertações da USPVentura, Ricardo VieiraAndrietta, Lucas Tassoni2022-07-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/10/10135/tde-21092022-081212/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-10-27T15:00:26Zoai:teses.usp.br:tde-21092022-081212Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-10-27T15:00:26Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite Applications of machine learning and genomic data to improve economic traits in dairy cattle |
title |
Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite |
spellingShingle |
Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite Andrietta, Lucas Tassoni Acasalamento dirigido Animal breeding Aprendizado de máquina Machine learning Mating scheme Melhoramento animal |
title_short |
Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite |
title_full |
Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite |
title_fullStr |
Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite |
title_full_unstemmed |
Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite |
title_sort |
Uso de Machine Learning e dados genômicos para melhoria de características econômicas em bovinos de leite |
author |
Andrietta, Lucas Tassoni |
author_facet |
Andrietta, Lucas Tassoni |
author_role |
author |
dc.contributor.none.fl_str_mv |
Ventura, Ricardo Vieira |
dc.contributor.author.fl_str_mv |
Andrietta, Lucas Tassoni |
dc.subject.por.fl_str_mv |
Acasalamento dirigido Animal breeding Aprendizado de máquina Machine learning Mating scheme Melhoramento animal |
topic |
Acasalamento dirigido Animal breeding Aprendizado de máquina Machine learning Mating scheme Melhoramento animal |
description |
Estratégias de acasalamento dirigido são consideradas ferramentas essenciais em programas de melhoramento animal. Com o advento da Seleção Genômica na última década, em associação aos avanços nas técnicas reprodutivas, nota-se diminuição no intervalo de gerações, aumentos na acurácia de predição e na intensidade de seleção, proporcionando expressivo ganho genético para os animais das cadeias produtivas. A fim de se compreender atributos das informações genotípicas e otimizar acasalamentos, objetivou-se neste estudo, por meio da simulação de uma população de bovinos leiteiros, a exploração de diferentes abordagens de extração de atributos de informações genotípicas de indivíduos do rebanho, tendo como objetivo a avaliação do desempenho preditivo ao se empregar tais dados por meio de dois algoritmos de Machine Learning (Random Forests e K-Nearest Neighbours) em 11 cenários propostos referentes ao coeficiente de endogamia (Froh), valor genético, além da proposta de um método de acasalamento. O uso das abordagens propostas de extração de atributos contribuiu para a diminuição dos dados a serem empregados nos modelos em até 98%, implicando na maioria dos cenários, em resultados mais representativos quando consideradas as informações reduzidas em dimensão quando comparadas a utilização de dados íntegros. Destacou-se o uso do algoritmo Random Forests para os cenários de regressão propostos, em especial na predição dos valores de Froh utilizando os genótipos dos pais em comparação a informação do próprio indivíduo, sendo o resultado de r2 do primeiro superior em 29%, quando utilizado o método de distância euclidiana proposto. Destaca-se também a abordagem visual proposta, favorecendo o desenvolvimento de estudos em busca de indivíduos a serem acasalados de acordo com os interesses relacionados a uniformidade de rebanho e a potenciais expoentes no quesito reprodução. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-07-22 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/10/10135/tde-21092022-081212/ |
url |
https://www.teses.usp.br/teses/disponiveis/10/10135/tde-21092022-081212/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809090967595122688 |