Seleção de famílias de cana-de-açúcar via árvores de decisão

The process of selection of clones to be used as new commercial varieties is lacking in statistical methods and phytotechnical that increase the genetic gains in crop improvement programs of cane sugar. Out of five stages of the selection program to improve the RIDESA, the first one, T1, is endowed...

Full description

Access type:openAccess
Publication Date:2013
Main Author: Bernardes, Diego Paiva lattes
Advisor: Peternelli, Luiz Alexandre lattes
Co-advisor: Barbosa, Marcio Henrique Pereira lattes, Nascimento, Moysés lattes
Referee: Kist, Volmir lattes
Document type: Master thesis
Language:por
Published: Universidade Federal de Viçosa
Program: Mestrado em Estatística Aplicada e Biometria
Department: Estatística Aplicada e Biometria
Portuguese subjects:
English subjects:
Knowledgement areas:
Online Access:http://locus.ufv.br/handle/123456789/4069
Citation:BERNARDES, Diego Paiva. Families selection through decision trees. 2013. 40 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2013.
Portuguese abstract:O processo de seleção de clones de cana-de-açúcar é carente de métodos fitotécnicos e estatísticos que elevem os ganhos genéticos nos programas de melhoramento da cultura da cana-de-açúcar. De cinco fases de seleção do programa de melhoramento da RIDESA, a primeira é dotada de grande importância porque dela se desenvolvem as demais fases do programa e porque o volume de informações a ser analisados é enorme. Assim, caso os dados não forem corretamente analisados, pode-se descartar bons materiais logo nas primeiras fases, diminuindo a excelência do programa. As estratégias usuais de seleção, BLUP e BLUPIS, têm a desvantagem de exigir a de pesagem de toda a parcela. Uma maneira de se contornar isso é categorizar os componentes de produção; altura de colmos, diâmetro de colmos e número de colmos, via árvores de decisão. Através dessas árvores, é possível gerar as combinações desses componentes de produção e os respectivos valores de produção. Utilizando dados de testemunhas para gerar as árvores, não seria necessária a pesagem de toda a parcela, economizando tempo e recursos financeiros. O objetivo desse trabalho foi avaliar a categorização dos componentes de produção como estratégia de seleção entre e dentro de famílias através da comparação de seu desempenho com os métodos usuais, BLUP e BLUPIS. O algoritmo de árvore utilizado foi o CART. De natureza não paramétrica, esse é capaz de produzir divisões binárias combinando as variáveis explicativas e associando-as com distintos valores de resposta. Os dados foram coletados de 5 experimentos, instalados em maio de 2007, no delineamento em blocos casualizados, sendo cada experimento constituído de 5 blocos, 22 famílias e 2 testemunhas. O algoritmo CART foi eficiente em definir as classes dos componentes de produção seguido da seleção das melhores famílias no campo com acurácia média próxima de 73% quando comparado com o BLUPIS e BLUP.
English abstract:The process of selection of clones to be used as new commercial varieties is lacking in statistical methods and phytotechnical that increase the genetic gains in crop improvement programs of cane sugar. Out of five stages of the selection program to improve the RIDESA, the first one, T1, is endowed with great importance. First because it develops the remaining phases of the crop breeding program. And second because the volume of information to be analyzed is huge. Thus, if the data is not properly analyzed, good clones can be ruled out in the early stages, reducing the excellence of the program. The common strategies of selection, BLUP and BLUPIS, have the disadvantage of the necessity of weighing the whole plot. One way around this is to categorize the components of production; stalk height, stalk diameter and number of stalks, by decision trees. Through these trees, you can generate the combinations of these yield components and their production values. Using data from commercial varieties to generate the trees, it would not be necessary to weigh the entire plot, saving time and money. The aim of this study was to evaluate the categorization of yield components as selection strategy between and within families by comparing their performance with the usual methods, BLUP and BLUPIS. The algorithm used was the CART. Nonparametric by nature, it`s capable of producing binary divisions combining the explanatory variables and associating them with different response values. Data were collected from 5 experiments, installed in May 2007 in a randomized block design, with each experiment consisting of 5 blocks, 22 families and two commercial varieties. CART algorithm was effective in defining classes of yield components followed by selection of the best families with mean accuracy of 73% when compared with BLUPIS and BLUP.