Use este identificador para citar ou linkar para este item: https://locus.ufv.br//handle/123456789/1649
Tipo: Tese
Título: Seleção de variáveis ambientais e de algoritmos de classificação para mapeamento digital de solos
Título(s) alternativo(s): Selection of environmental variables and classification algorithms for digital soil mapping
Autor(es): Cunha, Alexson de Mello
Primeiro Orientador: Lani, João Luiz
Primeiro coorientador: Fernandes Filho, Elpídio Inácio
Segundo coorientador: Ferreira Neto, José Ambrosio
Primeiro avaliador: Burak, Diego Lang
Segundo avaliador: Soares, Vicente Paulo
Terceiro avaliador: Francelino, Márcio Rocha
Abstract: No mapeamento digital de solos têm sido utilizados os atributos do terreno como as principais variáveis preditivas ambientais. Outras variáveis, relacionadas aos processos pedogenéticos, como as climáticas, não tem sido geralmente utilizadas. Nesse contexto, os objetivos deste estudo foram: (1) comparar o método da cokrigagem ordinária em com o da krigagem na espacialização da precipitação pluvial no Estado do Espírito Santo; (2) identificar no mapeamento de solos, em escalas diferentes, quais as variáveis mais relevantes para um melhor desempenho de predição das classes de solo, tendo como estudo duas áreas distintas; (3) avaliar o desempenho dos algoritmos classificadores NaiveBayes, rede neural multilayerperceptron - MLP, SimpleCart e J48.Na avaliação da krigagem e cokrigagem utilizaram-se dados de 108 postos pluviométricos e variáveis secundárias como altitude e distância do mar. Para a avaliação das variáveis e algoritmos classificadores no mapeamento de média escala (1:100.000) o estudo foi realizado na bacia do rio Muqui do Norte, sul do Estado do Espírito Santo. Utilizaram-se 598 amostras de treinamento (10 classes de solos) e 45variáveis relacionadas a diferentes fatores de formação dos solos, tais como: atributos do terreno, geologia, geomorfologia, clima, balanço hídrico e índices derivados das bandas 1, 3, 4 e 5 do sensor TM Landsat 5. Essas variáveis foram submetidas a diferentes métodos de seleção de atributos baseadas em correlação CFS; em consistência CSE; ganho de informação - IA e ReliefF , disponíveis no software Weka 3.6.8. Nesse software foi aplicado o classificador SimpleCart para avaliar a efetividade da predição com os subconjuntos de variáveis selecionadas. A avaliação dos quatro classificadores foi realizada com o uso das 45 variáveis e as selecionadas pelo algoritmo ReliefF . Para o mapeamento detalhado realizado no Assentamento Rural Sezínio Fernandes, em Linhares, ES, utilizaram-se 259 amostras de treinamento (3 classes de solos) e 19 variáveis preditivas (atributos do terreno, climáticas e balanço hídrico) nas predições feitas pelos classificadores SimpleCart, J48,MLP e NaiveBayes. As predições foram avaliadas com base na validação cruzada e comparações dos mapas elaborados com o mapa convencional de referência. Os resultados da interpolação sugerem que se deve preferir a cokrigagem e o uso de grades regulares para amostragem viiide variáveis secundárias. Os resultados da seleção de atributos para mapeamento da bacia do rio Muqui do Norte indicaram que os algoritmos ReliefF e o CSE, ambos limitados a 10 atributos, foram os que apresentaram árvores menos complexas e sem perda significativa na exatidão da predição em relação ao grupo de 45 variáveis. A exatidão da classificação, indicada pelo Kappa de 0,60, foi considerada muito boa. As variáveis selecionadas pelo ReliefF foram geologia, geomorfologia e principalmente atributos do terreno e elementos do balanço hídrico, como excedente hídrico, deficiência hídrica e evapotranspiração potencial. Os algoritmos NaiveBayes, MLP e SimpleCart apresentaram desempenhos de predição semelhantes (Kappa 0,60 a 0,66), superiores ao J48. A maior concordância com o mapa de referência obtida pelo algoritmo MLP, seguido do SimpleCart, J48 e NaiveBayes foi de 55, 52, 51 e 48%, respectivamente. Nas predições de classes de solos do Assentamento Sezinio Fernandes as variáveis excedente hídrico, deficiência hídrica e temperatura do ar foram relevantes. No entanto, as pequenas amplitudes de valores apresentadas pelas variáveis climáticas e balanço hídrico não são provavelmente suficientes para propiciar condições pedogenéticas diferenciadas na área de estudo. Não houve diferenças significativas entre os valores de Kappa (0,77 a 0,82) dos três algoritmos de classificação. As maiores concordâncias com o mapa convencional foram obtidas para o algoritmo J48, seguido do NaiveBayes e do SimpleCart, utilizando somente atributos de terreno como variáveis preditivas. As árvores de decisão por produzirem resultados de mais fácil entendimento e apresentarem em geral exatidões semelhantes aos classificadores NaiveBayes e rede neural MLP, podem ser consideradas como de grande potencial para se consolidarem no mapeamento digital de solos.
In digital soil mapping the terrain attributes have been used as the main environmental predictor variables. Other variables related to pedogenic processes, such as climate changes, has not been used often. In this context, the objectives of this study were: (1) to evaluate the method of cokriging ordinary kriging compared to the spatial distribution of rainfall in the State of Espírito Santo, (2) identify soil mapping at different scales, which variables most relevant for better performance prediction of soil classes, whose study two distinct areas, (3) evaluate the performance of the NaiveBayes classifier algorithm, neural network multilayerperceptron - MLP SimpleCart and J48. In the evaluation of kriging and cokriging were used data from 108 rain gauges and secondary variables such as altitude and distance from the sea. For the evaluation of the variables and the mapping algorithms classifiers medium scale (1:100,000) the study was conducted in the river basin Muqui North, south of Espirito Santo. We used 598 training instances (10 soil classes) and 45variáveis related to different factors of soil formation, such as terrain attributes, geology, geomorphology, climate, water balance and indices derived from bands 1, 3, and 4 5 Landsat 5 TM. These variables were subjected to different methods of feature selection based on correlation - CFS, in consistency - CSE, information gain - and IA "ReliefF", available in the software Weka 3.6.8. This software was applied SimpleCart classifier to evaluate the effectiveness of the prediction with the subsets of selected variables. The evaluation of the four binders was performed using the 45 variables and the algorithm selected by "ReliefF." For detailed mapping conducted in Rural Settlement Sezínio Fernandes, Linhares, ES, we used 259 training instances (three soil classes) and 19 predictor variables (terrain attributes, climate and water balance) in the predictions made by the classifiers SimpleCart, J48, MLP and NaiveBayes. The predictions were evaluated based on cross- validation and comparisons of maps made with the conventional map reference. The interpolation results suggest that cokriging to be preferred to the use of regular grids for sampling secondary variables. The results of the selection of attributes for mapping river basin Muqui North indicated that the algorithms "ReliefF" and CSE, both limited xto 10 attributes were those with less complex trees and without significant loss in accuracy prediction compared to group 45 variables. The classification accuracy, indicated by Kappa of 0.60 was considered very good. The variables selected by "ReliefF" were geology, geomorphology and especially terrain attributes and elements of the water balance, as water surplus, water deficit and potential evapotranspiration. Algorithms NaiveBayes, MLP and SimpleCart showed similar performance prediction (Kappa 0.60 to 0.66), higher than the J48. The highest agreement with the reference map obtained by the MLP algorithm, followed by SimpleCart, J48 and NaiveBayes was 55, 52, 51 and 48%, respectively. The predictions of soil from Settlement Sezinio Fernandes variables water surplus, water deficit and air temperature were relevant. However, the small amplitude values presented by climatic variables and water balance are probably not sufficient to provide different pedogenetic conditions in the study area. There were no significant differences between the Kappa values (0.77 to 0.82) of the three classification algorithms. The greatest agreement with the conventional map was obtained for the algorithm J48, followed by NaiveBayes and SimpleCart,using only the terrain attributesas predictors variables. Decision trees for producing results more easily understood and presented in general accuracies similar to NaiveBayes classifiers and neural network MLP, may be regarded as of great potential to consolidate the digital soil mapping.
Palavras-chave: Mapeamento de solos
Redes neurais
Árvore de decisão
Geoprocessamento
Soil mapping
Neural networks
Decision Tree
Geoprocessing
CNPq: CNPQ::CIENCIAS AGRARIAS::AGRONOMIA::CIENCIA DO SOLO
Idioma: por
País: BR
Editor: Universidade Federal de Viçosa
Sigla da Instituição: UFV
Departamento: Fertilidade do solo e nutrição de plantas; Gênese, Morfologia e Classificação, Mineralogia, Química,
Programa: Doutorado em Solos e Nutrição de Plantas
Citação: CUNHA, Alexson de Mello. Selection of environmental variables and classification algorithms for digital soil mapping. 2013. 132 f. Tese (Doutorado em Fertilidade do solo e nutrição de plantas; Gênese, Morfologia e Classificação, Mineralogia, Química,) - Universidade Federal de Viçosa, Viçosa, 2013.
Tipo de Acesso: Acesso Aberto
URI: http://locus.ufv.br/handle/123456789/1649
Data do documento: 16-Ago-2013
Aparece nas coleções:Solos e Nutrição de Plantas

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
texto completo.pdf6,03 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.