Use este identificador para citar ou linkar para este item: https://locus.ufv.br//handle/123456789/31497
Tipo: Tese
Título: Eficiência preditiva de características de qualidade da madeira de Eucalyptus com abordagens de Machine Learning aplicadas a dados NIR
Predictive efficiency of Eucalyptus wood quality characteristics with Machine Leaning approaches applied to NIR data
Autor(es): Ferraz, Alexandre Gomes
Abstract: A qualidade da madeira é uma das características decisivas na recomendação de clones nos programas de melhoramento de eucaliptos. Essa informação mensurada de forma acurada e precoce, auxilia nas decisões do melhorista e aumenta as chances de obter clones superiores. A mensuração dessa característica no gênero Eucalyptus é laboriosa, requer vários dias para determinação em laboratório, é um processo caro, aplicado em um número restrito de indivíduos e, muitas das vezes, demanda a perda total dos indivíduos amostrados. Para contornar essas dificuldades, a técnica de espectroscopia no infravermelho próximo tem sido uma alternativa que possibilita a predição dessas características da associação de comprimentos de ondas e as características avaliadas em laboratório. O principal método usado para predição é o dos mínimos quadrados parciais ou PLS (Partial Least Squares) que, apesar de eficiente para algumas características, ainda se mostra limitante no que se refere à acurácia preditiva, sendo necessário testar novas metodologias de predição. Além disso, os métodos de pré-tratamentos usados para limpeza dos dados espectrais são poucos difundidos, gerando muitas dúvidas de qual é o melhor a se usar. O objetivo desse trabalho foi avaliar a importância do uso de pré-tratamento na predição de características tecnológicas da madeira e testar metodologias de Machine Learning na predição dessas características, com base em informações de NIR (Near Infrared Spectroscopy), para fins de seleção indireta de indivíduos de Eucalyptus. O material para as análises foi composto por 75 indivíduos de E. benthamii 3 de E. saligna, 3 de E. grandis e 3 de E. dunnii, totalizando 87 indivíduos escolhidos por critérios industriais. Para avaliação dos pré-tratamentos e modelos de predição, foram usadas 11 características obtidas por análises laboratoriais. Para a avaliação da importância dos pré-tratamento, usou-se 15 métodos de pré-tratamentos, sendo que alguns apresentam parâmetros variáveis, totalizando 199 possibilidades. Para os modelos de predição, foram testadas 4 metodologias de Machine Learning (Árvores de decisão, Floresta Aleatória, bagging e boosting) e comparadas ao PLS em diferentes cenários (no mesmo background genético, usando diferentes background com os dados pré-tratados e sem pré-tratamento). A avaliação de pré-tratamento para fins de ajustes de modelos para predição foi indispensável via PLS. Diferentes técnicas de pré- tratamentos se mostram eficientes, considerando informações de diferentes características na população de E. benthamii, sendo recomendável estudos prévios para adequação do melhor pré-tratamento. O uso do pré-tratamento envolvendo técnicas de segunda derivada com gap se destacou no conjunto de dados analisados e deve ser enfatizado como uma alternativa vantajosa em estudos de ajuste de modelo. No estudo de predição, conclui-se que diferentes características se identificam com diferentes abordagens e que o procedimento PLS é uma opção de análise a ser considerada, mas seu generalizado não é recomendado, sendo que outras opções podem apresentar resultados comparativamente superiores. O background considerado nos conjuntos de dados de treinamento e validação influenciam os resultados. Validar conjuntos de mesmo background conduz a resultados de eficiência de predição mais elevados. Palavras-chave: Eucalyptus. Aprendizado de Máquina. Qualidade da Madeira. Melhoramento Genético.
The wood quality is one of the decisive traits in a clonal recommendation in Eucalyptus breeding programs. This information, measured accurately and early, helps in the breeder's decisions and increases the chances of obtaining superior clones. The measurement of this trait in the Eucalyptus genus is laborious, requires several days to be determined in the laboratory, is an expensive process, applied to a limited number of individuals and, often, requires the total loss of the sampled individuals. To overcome these difficulties, the technique of near-infrared spectroscopy has been an alternative that allows the prediction of these traits of the association of wavelengths and the traits evaluated in the laboratory. The main method used for prediction is the partial least squares or PLS which, despite being efficient for some traits, is still limiting in terms of predictive accuracy, making it necessary to test new prediction methodologies. In addition, the pre-treatment methods used to clean spectral data are not widespread, generating many doubts as to which is the best to use. The objective of this work was to evaluate the importance of the use of pre-treatment in the prediction of technological traits of wood and to test Machine Learning methodologies in the prediction of these traits, based on information from NIR (Near Infrared Spectroscopy), for the purpose of indirect selection of Eucalyptus individuals. The material for the analysis consisted of 75 individuals of E. benthamii 3 of E. saligna, 3 of E. grandis and 3 of E. dunnii, totaling 87 individuals chosen by industrial criteria. For the evaluation of pre-treatments and prediction models, 11 traits obtained by laboratory analysis were used. To assess the importance of pre-treatment, 15 pre-treatment methods were used, some of which have variable parameters, totaling 199 possibilities. For the prediction models, 4 Machine Learning methodologies were tested (Decision Trees, Random Forest, bagging and boosting) and compared to PLS in different scenarios (in the same genetic background, using different background with pre-treated and non- pre-treated data). The pre-treatment evaluation for the purpose of model adjustments for prediction was indispensable via PLS. Different pre-treatment techniques are shown to be efficient, considering information on different traits in the E. benthamii population, and prior studies are recommended for the adequacy of the best pre-treatment. The use of pre-treatment involving gapped second derivative techniques stood out in the analyzed dataset and should be emphasized as an advantageous alternative in model fit studies. In the prediction study, it is concluded that different characteristics are identified with different approaches and that the PLS procedure is an analysis option to be considered, but its generalization is not recommended, and other options may present comparatively superior results. The background considered in the training and validation datasets influences the results. Validating sets from the same background leads to higher prediction efficiency results. Keywords: Eucalyptus. Machine Learning. Wood Technology. Genetic Breeding.
Palavras-chave: Eucalyptus
Melhoramento genético
Tecnologia da madeira
Aprendizado do computador
Madeira - Qualidade
CNPq: Genética Quantitativa
Editor: Universidade Federal de Viçosa
Titulação: Doutor em Genética e Melhoramento
Citação: FERRAZ, Alexandre Gomes. Eficiência preditiva de características de qualidade da madeira de Eucalyptus com abordagens de Machine Learning aplicadas a dados NIR. 2022. 79 f. Tese (Doutorado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2022.
Tipo de Acesso: Acesso Aberto
Identificador DOI: https://doi.org/10.47328/ufvbbt.2022.544
URI: https://locus.ufv.br//handle/123456789/31497
Data do documento: 4-Jul-2022
Aparece nas coleções:Genética e Melhoramento

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
texto completo.pdftexto completo1,25 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.