• Nenhum resultado encontrado

Análise de agrupamentos sobre a matriz de distâncias euclidianas obtida via

Como foi apresentado anteriormente, encontrou-se a matriz de interações GA a partir dos dados originais, sobre a mesma, aplicou-se a metodologia AMMI e, em seguida, foi calculada a matriz de distâncias euclidianas para aplicação dos métodos de agrupamentos. Feito isso, aplicou-se bootstrap na matriz de interações GA, calculou-se a média das matrizes obtidas e o processo foi repetido.

Os grupos presentes aos dendrogramas obtidos a partir de 10.000 reamos- tragens foram obtidos utilizando o método de Mojena (1977) para a definição do ponto de corte e seguem nas figuras de 9 a 14.

Figura 9 - Dendrograma obtido pelo emprego do método do vizinho mais próximo com base na matriz de distâncias euclidianas via bootstrap da matriz de interações

Figura 10 - Dendrograma obtido pelo emprego do método do vizinho mais distante com base na matriz de distâncias euclidianas via bootstrap da matriz de interações

Figura 11 - Dendrograma obtido pelo emprego do método do centroide com base na matriz de distâncias euclidianas via bootstrap da matriz de interações

Figura 12 - Dendrograma obtido pelo emprego do método da mediana com base na matriz de distâncias euclidianas via bootstrap da matriz de interações

Figura 13 - Dendrograma obtido pelo emprego do método de Ward com base na matriz de distâncias euclidianas via bootstrap da matriz de interações

Figura 14 - Dendrograma obtido pelo emprego do método da ligação média entre gru- pos com base na matriz de distâncias euclidianas via bootstrap da matriz de interações

4.4 Correlação cofenética

Os valores das correlações cofenéticas (Tabela 5) foram, em sua maioria elevados (maiores que 0,7) tanto para os dados originais quanto para os dados após a reamostragem “bootstrap”. Em outras palavras, isso significa que a representação das ma- trizes de dissimilaridade está compatível e que, independente do método de agrupamento utilizado, a representação é válida. O único método que não obteve correlação cofené- tica alta foi o método de Ward, sendo o menos desejável para utilização nesta análise. O método de Ward tende a formar grupos homogêneos levando em consideração o nú- mero total de indivíduos para formação dos grupos o que, na nossa análise não é favorável principalmente pelo genótipo G19.

Tabela 6 - Correlação cofenética entre as matrizes cofenética e de dissimilaridade obtidas conforme o método de agrupamento utilizado

Métodos de agrupamento Matriz

Original Bootstrap

Vizinho mais próximo 0,69 0,77

Vizinho mais distante 0,72 0,80

Centroide 0,74 0,79

Mediana 0,72 0,77

Ward 0,59 0,58

Ligação média 0,80 0,82

Para todos os métodos estudados foi esboçada a distribuição empírica dos coeficientes de correlação cofenética via bootstrap com o intuito de verificar se a distribuição possui uma forma simétrica. Foi realizado também o teste de Mantel para verificar se a correlação que existe entre a matriz de distâncias obtida via bootstrap e a matriz cofenética é significativa.

Como foi apresentado na Tabela 6, o coeficiente de correlação cofenética (r) para o método do vizinho mais próximo baseado na distância euclidiana foi de 0,77; indi- cando uma boa representação das distâncias no dendrograma. Esse valor foi significativo pelo teste de Mantel ao nível de 1% de significância, baseado em 1.000 reamostragens.

(a) (b)

Figura 15 - (a) Correlação cofenética para as matrizes de dissimilaridade obtidas com o método do vizinho mais próximo, baseado na distância euclidiana (b) Distri- buição empírica do coeficiente de correlação cofenética obtida via boostrap para o método do vizinho mais próximo utilizando o teste de Mantel

Como foi apresentado na Tabela 6, o coeficiente de correlação cofenética (r) para o método do vizinho mais distante baseado na distância euclidiana foi de 0,80; indi- cando uma boa representação das distâncias no dendrograma. Esse valor foi significativo pelo teste de Mantel ao nível de 1% de significância, baseado em 1.000 reamostragens.

(a) (b)

Figura 16 - (a) Correlação cofenética para as matrizes de dissimilaridade obtidas com o método do vizinho mais distante, baseado na distância euclidiana (b) Distri- buição empírica do coeficiente de correlação cofenética obtida via boostrap para o método do vizinho mais distante utilizando o teste de Mantel

Como foi apresentado na Tabela 6, o coeficiente de correlação cofenética (r) para o método do centroide baseado na distância euclidiana foi de 0,79; indicando uma boa representação das distâncias no dendrograma. Esse valor foi significativo pelo teste de Mantel ao nível de 1% de significância, baseado em 1.000 reamostragens.

(a) (b)

Figura 17 - (a) Correlação cofenética para as matrizes de dissimilaridade obtidas com o método do centroide, baseado na distância euclidiana (b) Distribuição empírica do coeficiente de correlação cofenética obtida via boostrap para o método do centroide utilizando o teste de Mantel

Como foi apresentado na Tabela 6, o coeficiente de correlação cofenética (r) para o método da mediana baseado na distância euclidiana foi de 0,77; indicando uma boa representação das distâncias no dendrograma. Esse valor foi significativo pelo teste de Mantel ao nível de 1% de significância, baseado em 1.000 reamostragens.

(a) (b)

Figura 18 - (a) Correlação cofenética para as matrizes de dissimilaridade obtidas com o método da mediana, baseado na distância euclidiana (b) Distribuição empírica do coeficiente de correlação cofenética obtida via boostrap para o método da mediana utilizando o teste de Mantel

Como foi apresentado na Tabela 6, o coeficiente de correlação cofenética (r) para o método de Ward baseado na distância euclidiana foi de 0,58 que embora seja um valor baixo em relação aos outros, foi significativo pelo teste de Mantel ao nível de 1% de significância, baseado em 1.000 reamostragens.

(a) (b)

Figura 19 - (a) Correlação cofenética para as matrizes de dissimilaridade obtidas com o método de Ward, baseado na distância euclidiana (b) Distribuição empírica do coeficiente de correlação cofenética obtida via boostrap para o método de Ward utilizando o teste de Mantel

Como foi apresentado na Tabela 6, o coeficiente de correlação cofenética (r) para o método da ligação média baseado na distância euclidiana foi de 0,82; indicando uma boa representação das distâncias no dendrograma. Esse valor foi significativo pelo teste de Mantel ao nível de 1% de significância, baseado em 1.000 reamostragens.

(a) (b)

Figura 20 - (a) Correlação cofenética para as matrizes de dissimilaridade obtidas com o método da ligação média, baseado na distância euclidiana (b) Distribuição empírica do coeficiente de correlação cofenética obtida via boostrap para o método da ligação média utilizando o teste de Mantel

Os métodos apresentados têm o mesmo objetivo, de agrupar indivíduos se- melhantes dado um critério de parecença, e como foi possível observar, podem apresentar resultados bastante parecidos. Sobre qual critério utilizar, o pesquisador deve conhecer as propriedades, qualidades e deficiências de cada um desses e escolher àquele que melhor se adequar com a pesquisa em questão.

O principal problema encontrado na aplicação da análise de agrupamentos, é o fato de não existir um critério objetivo para a classificação dos grupos, um critério que determine o ponto de corte. Existem diversos métodos para determinar o ponto de corte, cada pesquisador deve utilizar aquele que melhor represente a realidade dos dados. Outro fator que dificulta a análise de agrupamentos, é se o pesquisador tiver um número alto de dados, pois a visualização do dendrograma fica comprometida. Esse problema pode ser resolvido fazendo-se o uso de um método não-hierárquico.

Para dados de genótipos, conciliar a análise de agrupamentos com a análise AMMI foi de grande valia. Quando se faz primeiramente a análise AMMI, já é possível verificar quais genótipos têm propriedades semelhantes, então já é de se esperar que genó- tipos semelhantes sejam de um mesmo grupo na análise de agrupamentos. Sendo assim, sempre que os dados forem desse tipo, é interessante unir as duas análises.

Com os softwares se desenvolvendo cada vez mais e pela rapidez com que o mesmos computam os resultados, a reamostragem “bootstrap” tem sido bastante uti- lizada em pesquisas com a finalidade de se estudar estabilidade, distribuições empíricas, intervalos de confiança, dentre outros assuntos nos quais a mesma é extramamente valiosa quando é desejado alta qualidade na informação sobre estabilidade dos dados em estudo.

5 CONSIDERAÇÕES FINAIS

O principal objetivo deste trabalho foi identificar a estabilidade de agrupa- mentos formados em dados de genótipos de soja e, em paralelo, foi feita a análise AMMI dos mesmos dados para comparação futura dos resultados.

Concluiu-se que independente do método de agrupamento utilizado, em sua maioria os resultados foram semelhantes, e comparando os mesmos com a metodologia AMMI, é possível conseguir excelentes resultados.

Essa metodologia é extremamente eficiente para identificação de genótipos divergentes, difíceis de se substituir em fins de melhoramento genético. Em paralelo, a metodologia é eficiente também para identificação de genótipos similares para reduções futuras que sejam necessárias em um programa de melhoramento e que não provoque redução do potencial desejado.

REFERÊNCIAS

ABREU, V.M.N.; SILVA, M.A.; CRUZ, C.D.; FIGUEIREDO, E.A.P.; ABREU, P.G.;

Desempenho e Predição de Híbridos e Análise de Agrupamento de Características de Matrizes de Frangos de Corte. Revista Brasileira de Zootecnia, Viçosa, v.31, n.2, p.617-626, 2002. ALBUQUERQUE, M.A. Estabilidade em análise de agrupamento (cluster analysis). 2005. 64p. Dissertação (Mestrado em Biometria) - Universidade Federal Rural de Pernambuco, Recife, 2005.

ALBUQUERQUE, M.A.; FERREIRA, R.L.C.; SILVA, J.A.A.; SANTOS, E.S.; STOSIC, B.; SOUZA, A.L. Estabilidade em análise de agrupamento: Estudo de caso em ciência florestal. Revista Árvore, Viçosa, v.30, n.2, p. 257-265, 2006.

ARAÚJO, M.F.C. Teste estatístico para contribuição de genótipos e ambientes na matriz de interação GE. 2008. 113p. Dissertação (Mestrado em Estatística e

Experimentação Agronômica) - Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo, Piracicaba, 2008.

BARROS, E.A.C., Aplicações de Simulação Monte Carlo e Bootstrap. 2005. 52p. Monografia (Estatística) - Universidade Estadual de Maringá, Maringá, 2005.

BARROSO, L.P.; ARTES, R., Análise Multivariada. Lavras: UFLA, 2003. 157p.

BRASIL, E.M. Comparação de métodos no estudo da interação genótipo × ambiente em milho (Zea mays L.). 1990. 214p. Dissertação (Mestrado em Agronomia) - Universidade Federal de Goiás, Goiânia, 1990.

BUSSAB, W.O.; MIAZAKI, E.S.; ANDRADE, D. Introdução à análise de agrupamentos. São Paulo: Associação Brasileira de Estatística, 1990. 105p.

CHAVES, L.J. Interação de cultivares com ambientes. In: NASS, L.L.; VALOIS, A.C.C.; MELO, I.S., VALADARES, M.C. Recursos genéticos e melhoramento - plantas. Rondonópolis: Fundação MT, 2001. p.673-713.

CORNELIUS, P.L.; SEYEDSADR, M.; CROSSA, J. Using the shifted multiplicative mode to search for “separability” in crop cultivar trials. Theoretical and Applied Genetics, New York, v.84, p.161-172, 1992.

CROSSA, J.; GAUCH, H.G.; ZOBEL, R.W. Additive main effects and multiplicative

interaction analysis of two international maize cultivar trials. Crop Science, Madison, v.30, n.3, p.493-500, 1990.

CRUZ, C.D.; CARNEIRO, P.C.S. Modelos biométricos aplicados ao melhoramento genético. Viçosa: UFV, 2003. 585p.

CRUZ, C.D.; REGAZZI, A.J. Modelos biométricos aplicados ao melhoramento genético. Viçosa: UFV, 1994. 390p.

DIAS, L.A.S. Análises multidimensionais. In: ALFENAS, A.C. (Ed.). Eletroforese de isoenzimas e proteínas afins: fundamentos e aplicações em plantas e microorganismos. Viçosa: UFV, 1998. p.405-475.

DUARTE, J.B.; VENCOVSKY, R. Interação genótipo × ambiente: uma introdução à análise “AMMI”. Ribeirão Preto: Sociedade Brasileira de Genética, 1999. 60p.

DUARTE, J.B.; ZIMMERMANN, M.J.O. Selection of locations for common bean (Phaseolus vulgaris L.) germoplasm evalution. Revista Brasileira de Genética, Ribeirão Preto, v.14, n.3, p.765-770, 1991.

EFRON, B. Bootstrap methods: another look at jacknife. Annals of Statistics, Hayward, v.7, n.1, p.1-26, 1979.

EFRON, B.; TIBSHIRANI, R. An introduction to the bootstrap. New York: Chapman & Hall, 1993. v.57, (Monographs on Statistics and Applied Probability).

FARIA, P.N. Utilização de técnicas multivariadas na análise da divergência genética via modelo AMMI com reamostragem “bootstrap” . 2012. 130p. Tese (Doutorado em Estatística e Experimentação Agronômica) - Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo, Piracicaba, 2012.

FERREIRA, P.V. Estatística experimental aplicada à agronomia. Maceió: ADUFAL, 2000. 422p.

GABRIEL, K.R. The biplot graphic display of matrices with application to principal component analisys. Biometrika. Great Britain, v.58, n.03, p.453-467, 1971.

GAUCH JÚNIOR, H.G. Statistical analysis of regional yield trials: AMMI analysis of factorial designs. Amsterdam: Elsevier, 1992. 278p.

GAUCH, H.G.; ZOBEL, R.W. AMMI analysis of yield trails. In: KANG, M.S.; GAUCH, H.G. (Ed.). Genotype by environment interaction. New York: CRC Press, 1996. p.416-428. GONZALEZ, L.M.A.R. Estudo da interação de genótipos × ambientes para a cultura de algodão (Gossypium sp) na região oriental do Paraguai. 1988. 91p. Dissertação (Mestrado em Genética e Melhoramento de Plantas) - Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo, Piracicaba, 1988.

GOLLOB, H.F.A statistical model which combines features of factor analytic and analysis of variance techniques. Psychometrika, Greensboro, v.33, n.1, p.73-115, 1968.

HILL, R.R.; ROSENBERGER, J.L. Methods for combining data from germplasm evaluation trials. Crop Science, Madison, v.25, p.467-470, 1985.

HONGYU, K. Distribuição empírica dos autovalores associados à matriz de interação dos modelos AMMI pelo método bootstrap não-paramétrico. 2012. 103p. Dissertação (Mestrado em Estatística e Experimentação Agronômica) - Escola Superior de Agricultura Luiz de Queiroz, Universidade de São Paulo, Piracicaba, 2012.

JOHNSON, R.A.; WICHERN, D.W. Applied Multivariate Statistical Analysis. New Jersey, USA: Englewood Cliffs, 1992. 642p.

KEMPTON, R.A. The use of biplots in interpreting variety by environmet interactions. Journal of Agricultural Science, Cambridge, v.103, p.123-135, 1984.

KLEFENS, P.C.O. O biplot na análise fatorial multivariada. 2009. 103p. Dissertação (Mestrado em Estatística e Experimentação Agronômica) - Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo, Piracicaba, 2009.

LAVORANTI, O.J. Estabilidade e adaptabilidade fenotípica através da reamostragem “bootstrap” no modelo AMMI. 2003. 184p. Tese (Doutorado em Estatística e

Experimentação Agronômica) - Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo, Piracicaba, 2003.

MAHALANOBIS, P.C. On the generalized distance in statistics. Proceedings of The National Institute of Sciences of India, India, v.12, p.49-55, 1936.

MANDEL, J. A new analysis of variance model for non-additive data. Technometrics, Alexandria, v.13, n.1. 1971. p.1-18.

MANLY, B.F.J. Métodos Estatísticos Multivariados: Uma Introdução, 3a edição, Bookman, Porto Alegre, 2008. 229p.

MANTEL, N. The detection of disease clustering and generalizes regression approach. Cancer Research, Chestnut, v.27, p.209-220, 1967.

MILLIGAN, G.W.; COOPER, M.C. An examination of procedures for determining the number of cluster in a data set. Psychometrika, Williamsburg, v.50, p.159-179, 1985.

MOJENA, R. Hierarquical grouping methods and stopping rules: an evaluation. The Computer Journal, Kingston, v.20, n.4, p.359-363, 1977.

PEARSON, K. On lines and planes of closest fit to systems of points in space. Philosophical Magazine, Philadelphia, v.6, n.2, p.559-572, 1901.

PIEPHO, H.P. Robustness of statistical test for multiplicative terms in the additive main effects and multiplicative interaction model for cultivar trial. Theoretical Apllied of Genetics, Berlin, v.90, p.438-443, 1995.

PIOVESAN, P. Validação cruzada com correção de autovalores e regressão isotônica nos modelos AMMI. 2007. 78p. Dissertação (Mestrado em Estatística e Experimentação Agronômica) - Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo, Piracicaba, 2007.

RAMALHO, M.A.P.; SANTOS, J.B.; ZIMMERMANN, M.J.O. Genética quantitativa em plantas autógamas: aplicações ao melhoramento do feijoeiro. Goiânia: UFG, 1993. 271p.

SARTORIO, S.D. Aplicações de técnicas de análise multivariada em experimentos agropecuários usando o software R. 2008. 131p. Dissertação (Mestrado em Estatística e Experimentação Agronômica) - Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo, Piracicaba, 2008.

SILVA, A.R. Métodos de agrupamento: Avaliação e aplicação ao estudo de divergência genética em acessos de alho. 2012. 83p. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2012.

SOUZA, E.C. Os métodos Biplot e escalonamento multidimensional nos delineamentos experimentais. 2010. 135p. Tese (Doutorado em Estatística e

Experimentação Agronômica) - Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo, Piracicaba, 2010.

ZOBEL, R.W.; WRIGHT, M.J.; GAUCH, H.G. Statistical analysis of a yield trial. Agronomy Journal, Madison, v.80, p.388-393, 1988.

APÊNDICE A - Programação feita no software R rm(list = ls(all = TRUE)) ## Limpando a memória ##

setwd("C:/Users/User/Desktop/Dissertação Débora") ## Definindo o diretório ## ## Entrando com o conjunto de dados ##

dados <- read.csv2("conjuntodedados.csv", head = TRUE); dados library(agricolae) ## Pacote para realizar a análise AMMI ## ## Nomeando as colunas da matriz de dados ##

Ambientes <- dados[, 1]; Ambientes Genotipos <- dados[, 3]; Genotipos Blocos <- dados[, 2]; Blocos Producao <- dados[, 4]; Producao ## Análise AMMI ##

## Comando para realizar a análise AMMI ##

Modelo <- AMMI(Ambientes, Genotipos, Blocos, Producao, MSE, number = FALSE, graph = "biplot")

## Exibe a interação de cada genótipo com um respectivo ambiente, isto é, ## ## a combinação de todos os genótipos com todos os ambientes ##

Modelo$genXenv

## Agora, vamos montar nossa matriz de interação GA ## ListaGA <- Modelo$genXenv; ListaGA

A1 <- ListaGA[1:24]; A1 A2 <- ListaGA[25:48]; A2 A3 <- ListaGA[49:72]; A3 A4 <- ListaGA[73:96]; A4 A5 <- ListaGA[97:120]; A5

M <- cbind(A1, A2, A3, A4, A5); M

dimnames(M)[1] <- list(c(1, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 2, 20, 21, 22, 23, 24, 3, 4, 5, 6, 7, 8, 9)); M MatrizGA <- rbind(M[1, ], M[12, ], M[18, ], M[19, ], M[20, ], M[21, ], M[22, ], M[23, ], M[24, ], M[2, ], M[3, ], M[4, ], M[5, ], M[6, ], M[7, ], M[8, ], M[9, ], M[10, ], M[11, ], M[13, ], M[14, ], M[15, ], M[16, ], M[17, ])

## Nomeando as linhas da matriz GA##

## Construção do gráfico do PC1 pela produção de grãos ## Modelo$biplot

Biplot <- Modelo$biplot[, 1:4]; Biplot PC1 <- Modelo$biplot$PC1; PC1

PC2 <- Modelo$biplot$PC2; PC2

Prod <- Modelo$biplot$Producao; Prod length(PC1)

length(Prod)

## Fazendo o gráfico ## par(cex = 0.8)

plot(Prod, PC1, cex = 0, text(Prod, PC1, cex = 0.8, labels = row.names(Biplot), col = "blue"), main = "Biplot AMMI", frame = TRUE)

MEANS <- mean(Prod)

abline(h = 0, v = MEANS, lty = 2, col = "red") Biplot

amb <- subset(Biplot, type == "ENV"); amb Produ <- amb$Producao; Produ

PC1amb <- amb$PC1; PC1amb s <- seq(1, length(Produ)); s

arrows(MEANS, 0, 0.9*(Produ[s] - MEANS) + MEANS, 0.9*PC1amb[s], col = "brown", code = 2, lwd = 1.8, length = 0.1)

## Encontrando a matriz de distâncias euclidianas referente à matriz de interação GA ## distancias <- dist(MatrizGA, method = "euclidean"); distancias # Matriz de distâncias round(distancias, 2) ## Arredondando para duas casas decimais ##

require(cluster) # Pacote para realizar a AA

## Obtendo a separação dos grupos no dendrograma sengundo o valor k fornecido ## ## Definindo k para o Determinação do ponto de corte ##

k = 1.25 ## MILLIGAN, COOPER; 1985 ## ## Iniciando os métodos de agrupamento ## ## Método da ligação média entre grupos ## UPGMA <- hclust(distancias, method = "average")

## Determinação do ponto de corte ##

PCUPGMA <- mean(UPGMA$height) + k*sd(UPGMA$height); PCUPGMA

## Esboçando o gráfico com a determinação do ponto de corte e exibindo ## ## os agrupamentos ##

plot(UPGMA, hang = -1, cex = 0.8, ylab = "Distâncias", xlab = "Genótipos", main="Dendrograma", sub="(Método da ligação média entre grupos)") abline(h = PCUPGMA, v = NULL, col = 4, lty = 2)

G <- rect.hclust(UPGMA, h = PCUPGMA, which = c(1:3), border = 1:6); G ## Calculando o coeficiente de correlação cofenética ##

cofUPGMA <- cophenetic(UPGMA) cor(distancias, cofUPGMA) ## Método de Ward ##

Ward <- hclust(distancias, method = "ward") ## Determinação do ponto de corte ##

PCWard <- mean(Ward$height)+k*sd(Ward$height); PCWard

## Esboçando o gráfico com a determinação do ponto de corte e exibindo ## ## os agrupamentos ##

plot(Ward, hang = -1, cex = 0.8, ylab = "Distâncias", xlab = "Genótipos", main="Dendrograma", sub="(Método de Ward)")

abline(h = PCWard, v = NULL, col = 4, lty = 2)

H <- rect.hclust(Ward, h = PCWard, which = c(1:3), border = 1:6) ## Calculando o coeficiente de correlação cofenética ##

cofWard <- cophenetic(Ward) cor(distancias, cofWard) ## Método do centroide ##

cen <- hclust(distancias, method = "centroid")

## Determinação do Determinação do ponto de corte ## PCcen <- mean(cen$height) + k*sd(cen$height); PCcen

## Esboçando o gráfico com a determinação do ponto de corte e exibindo ## ## os agrupamentos ##

plot(cen, hang = -1, cex = 0.8, ylab = "Distâncias", xlab = "Genótipos", main="Dendrograma", sub="(Método do centroide)")

I <- rect.hclust(cen, h = PCcen, which = c(1:3), border = 1:6) ## Calculando o coeficiente de correlação cofenética ##

cofcen <- cophenetic(cen) cor(distancias, cofcen) ## Método da mediana ##

med <- hclust(distancias, method = "median") ## Determinação do ponto de corte##

PCmed <- mean(med$height) + k*sd(med$height); PCmed

## Esboçando o gráfico com a determinação do ponto de corte e exibindo ## ## os agrupamentos ##

plot(med, hang = -1, cex = 0.8, ylab = "Distâncias", xlab = "Genótipos", main="Dendrograma", sub="(Método da mediana)")

abline(h = PCmed, v = NULL, col = 4, lty = 2)

J <- rect.hclust(med, h = PCmed, which = c(1:3), border = 1:6) ## Calculando o coeficiente de correlação cofenética ##

cofmed <- cophenetic(med) cor(distancias, cofmed)

## Método do vizinho mais distante ##

distante <- hclust(distancias, method = "complete") ## Determinação do ponto de corte##

PCdistante <- mean(distante$height) + k*sd(distante$height); PCdistante ## Esboçando o gráfico com a determinação do ponto de corte e exibindo ##

## os agrupamentos ##

plot(distante, hang = -1, cex = 0.8, ylab = "Distâncias", xlab = "Genótipos", main="Dendrograma", sub="(Método do vizinho mais distante)")

abline(h = PCdistante, v = NULL, col = 4, lty = 2)

K <- rect.hclust(distante, h = PCdistante, which = c(1:4), border = 1:6) ## Calculando o coeficiente de correlação cofenética ##

cofdistante <- cophenetic(distante) cor(distancias, cofdistante)

## Método vizinho mais próximo ##

## Determinação do ponto de corte ##

PCprox <- mean(prox$height) + k*sd(prox$height); PCprox

## Esboçando o gráfico com a determinação do ponto de corte e exibindo ## ## os agrupamentos ##

plot(prox, hang = -1, cex = 0.8, ylab = "Distâncias", xlab = "Genótipos", main="Dendrograma", sub="(Método do vizinho mais próximo)")

abline(h = PCprox, v = NULL, col = 4, lty = 2)

L <- rect.hclust(prox, h = PCprox, which = c(1:3), border = 1:6) ## Calculando o coeficiente de correlação cofenética ##

cofprox <- cophenetic(prox) cor(distancias, cofprox)

## Reamostragem bootstrap da matriz de interação GA ## nr <- 10000 ## Número de reamostragens ##

boot <- lapply(1:nr, function(i) MatrizGA[, sample(ncol(MatrizGA), ncol(MatrizGA), replace = T)])

msoma <- matrix(0, ncol = 5, nrow = 24); msoma for(i in 1:nr){

msoma <- msoma + boot[[i]] }

msoma

MatrizGA2 <- msoma/nr; MatrizGA2

## Análise de agrupamentos para a nova matriz de interação obtida ## ## via método bootstrap ##

distanciasboot <- dist(MatrizGA2, method = "euclidean"); distanciasboot round(distanciasboot, 2) ## Arredondando para duas casas decimais ##

## Refazendo todos os métodos de agrupamentos para a nova matriz de distâncias ## ## Método da ligação média entre grupos ##

UPGMAb <- hclust(distanciasboot, method = "average") ## Determinação do ponto de corte ##

PCUPGMAb <- mean(UPGMAb$height) + k*sd(UPGMAb$height); PCUPGMAb

## Esboçando o gráfico com a determinação do ponto de corte e exibindo ## ## os agrupamentos ##

plot(UPGMAb, hang = -1, cex = 0.8, ylab = "Distâncias", xlab = "Genótipos", main="Dendrograma", sub="(Método da ligação média entre grupos)") abline(h = PCUPGMAb, v = NULL, col = 4, lty = 2)

Gb <- rect.hclust(UPGMAb, h = PCUPGMAb, which = c(1:3), border = 1:6); Gb ## Coeficiente de correlação cofenética ##

cofUPGMAb <- cophenetic(UPGMAb) vcofUPGMAb <- c(cofUPGMAb) vcofUPGMAb vdistanciasb <- c(distanciasboot) vdistanciasb cor(vcofUPGMAb, vdistanciasb)

plot(vdistanciasb, vcofUPGMAb, xlab = "Matriz de distâncias",

ylab = "Matriz cofenética (ligação média)", main="Correlação cofenética") text(7, 0.5, "r = 0,82**")

## Fazendo o teste de Mantel ##

require(ape) ## Pacote que realiza o teste de Mantel ##

mantel.test(as.matrix(distanciasboot), as.matrix(cophenetic(UPGMAb)),

nperm = 1000, graph = T, xlab = "Estatística - z", ylab = "Densidade", main = "Teste de Mantel (Ligação média entre grupos)")

## Método de Ward ##

Wardb <- hclust(distanciasboot, method = "ward") ## Determinação do ponto de corte ##

PCWardb <- mean(Wardb$height) + k*sd(Wardb$height); PCWardb

## Esboçando o gráfico com a determinação do ponto de corte e exibindo ## ## os agrupamentos ##

plot(Wardb, hang = -1, cex = 0.8, ylab = "Distâncias", xlab = "Genótipos", main="Dendrograma", sub="(Método de Ward)")

abline(h = PCWardb, v = NULL, col = 4, lty = 2)

Hb <- rect.hclust(Wardb, h = PCWardb, which = c(1:3), border = 1:6); Hb ## Coeficiente de correlação cofenética ##

cofWardb <- cophenetic(Wardb)

vcofWardb <- c(cofWardb); vcofWardb cor(vcofWardb, vdistanciasb)

plot(vdistanciasb, vcofWardb, xlab = "Matriz de distâncias",

text(7, 1, "r = 0,58")

## Fazendo o teste de Mantel ##

mantel.test(as.matrix(distanciasboot), as.matrix(cophenetic(Wardb)),

nperm = 1000, graph = T, xlab = "Estatística - z", ylab = "Densidade", main = "Teste de Mantel (Ward)")

## Método do centroide ##

cenb <- hclust(distanciasboot, method = "centroid") ## Determinação do ponto de corte ##

PCcenb <- mean(cenb$height) + k*sd(cenb$height); PCcenb

## Esboçando o gráfico com a determinação do ponto de corte e exibindo ## ## os agrupamentos ##

plot(cenb, hang = -1, cex = 0.8, ylab = "Distâncias", xlab = "Genótipos", main="Dendrograma", sub="(Método do centroide)")

abline(h = PCcenb, v = NULL, col = 4, lty = 2)

Ib <- rect.hclust(cenb, h = PCcenb, which = c(1:3), border = 1:6); Ib ## Coeficiente de correlação cofenética ##

cofcenb <- cophenetic(cenb) vcofcenb <- c(cofcenb); vcofcenb

Documentos relacionados