XXI Encontro Latino Americano de Iniciação Científica, XVII Encontro Latino Americano de Pós-Graduação e VII Encontro de Iniciação à Docência – Universidade do Vale do Paraíba. 1
APLICAÇÃO DA ESTATÍSTICA PARAMÉTRICA NA EXPERIMENTAÇÃO
AGRÍCOLA.
Samuel Ferreira da Silva¹, Carolina de Oliveira Bernardes², Patrícia Alvarez
Cabanez², Lucas Rosa Pereira², Fabricio Dias Heitor¹, Luiza Alves Mendes²,
Taís Rizzo Moreira¹, Gleissy Mary Amaral Dino Alves dos Santos¹, Lucas
Louzada Pereira³ e Alexandre Rosa dos Santos¹.
¹Universidade Federal do Espírito Santo/Centro de Ciências Agrárias e Engenharias, Av. 15, Gov. Lindemberg, nº 316, Centro, Jerônimo Monteiro - ES, Brasil, CEP: 29550-000. E-mails:
samuelfd.silva@yahoo.com.br, fabriciodheitor@hotmail.com, taisr.moreira@hotmail.com, gleissym@yahoo.com.br e mundogeomatica@yahoo.com.br.
²Universidade Federal do Espírito Santo/Centro de Ciências Agrárias e Engenharias, Alto Universitário, s/nº, Guararema, Alegre - ES, Brasil, CEP: 29500-000, CP: 16. E-mails: carolinabernardes84@yahoo.com.br, capac@hotmail.com, lucasrosapereira@hotmail.com e
luizavargasmendes@hotmail.com.
³Universidade Federal do Rio Grande do Sul, Av. Osvaldo Aranha, nº 99, 5º andar, Bom Fim, Porto Alegre - RS, Brasil, CEP: 90035-190. E-mail: lucaslozada@hotmail.com.
Resumo - Objetivou-se elaborar uma revisão de literatura sobre a utilização da estatística
paramétrica em experimentos agrícolas. Para tanto, realizou-se uma busca de artigos por meio de um levantamento de publicações sobre o tema deste trabalho. As palavras-chave empregadas foram: estatística paramétrica, experimentação agrícola, agricultura experimental, obtenção de dados, testes estatísticos e modelos matemáticos nos idiomas português, espanhol e inglês. Primeiramente, a seleção foi feita a partir dos resumos e, posteriormente, os textos completos foram analisados. Com base nos resultados alcançados foi possível inferir que o entendimento dos princípios básicos da experimentação é de suma importância para a escolha e aplicação do método mais adequado para se obter dados confiáveis, auxiliando na tomada de decisões quanto a sua aplicação na experimentação agrícola. Entretanto, se for realizada sem critérios técnicos e se ignorado os princípios metodológicos da experimentação os dados obtidos poderão ser comprometidos e neste caso, obrigatoriamente, os mesmos devem ser descartados e o experimento refeito.
Palavras-chave: agricultura, obtenção de dados, testes estatísticos, confiabilidade experimental.
Área do Conhecimento: Engenharia Agronômica Introdução
Os testes paramétricos baseiam-se em medidas intervalares da variável dependente (um parâmetro ou característica quantitativa de uma população), e a utilização destes testes exigem que sejam satisfeitos alguns quesitos, sendo estes, distribuição normal e variância homogénea dos doados, além de intervalos de avaliação contínuos e iguais (TUCKMAN, 2000; BISHOP et al., 2011; DÍEZ et al., 2017).
Partindo da premissa de que a distribuição de frequências dos erros amostrais é normal, as variâncias são homogêneas, os efeitos dos fatores de variação são aditivos e os erros independentes. Se tudo isso ocorrer, é muito provável que a amostra seja aceitavelmente simétrica, terá com certeza apenas um ponto máximo, centrado no intervalo de classe onde está a média da distribuição, e o seu histograma de frequências terá um contorno que seguirá aproximadamente o desenho em forma de sino da curva normal. Portanto, os cumprimentos desses requisitos condicionam a escolha da utilização da estatística paramétrica, cujos testes são em geral mais poderosos (HU, 2015; GROVER et al., 2017).
Na experimentação agrícola os testes paramétricos são válidos quando aplicados a dados que obedecem a uma distribuição normal, sendo que, uma distribuição normal é aquela que é perfeitamente simétrica à volta da média, além disso, os resultados são mais fáceis de comparar parametricamente quando a variância ou a variabilidade dos dados, nos dois grupos, for igual ou
XXI Encontro Latino Americano de Iniciação Científica, XVII Encontro Latino Americano de Pós-Graduação e VII Encontro de Iniciação à Docência – Universidade do Vale do Paraíba. 2 homogénea. Se os dois grupos submetidos ao mesmo teste de realização apresentarem médias iguais, mas distribuições diferentes, seria difícil interpretar um teste paramétrico, devido às diferenças na dispersão ou variância dos resultados, nos dois grupos. Portanto, os testes paramétricos, tal como estão concebidos, podem aplicar-se apenas em dados (medidas relativas à variável dependente) que constituem uma escala de intervalos, ou seja, têm entre si intervalos contínuos e iguais (TUCKMAN, 2000; YANG et al., 2011; PEŘINA; KŘEPELKA, 2013).
Diante do exposto, entender tais comportamentos é de suma importância para se identificar qual teste estatístico deve ser aplicado aos dados obtidos. Desta forma, objetivou-se com a realização deste trabalho elaborar uma revisão de literatura sobre a aplicação da estatística paramétrica em experimentos agrícolas.
Metodologia
A busca pelos artigos desta revisão foi realizada por meio de um levantamento de publicações sobre o tema deste trabalho. As palavras-chave empregadas foram: estatística paramétrica, experimentação agrícola, agricultura experimental, obtenção de dados, testes estatísticos e modelos matemáticos nos idiomas português, espanhol e inglês.
Primeiramente, a seleção foi feita a partir dos resumos e, posteriormente, os textos completos foram analisados. Os critérios de relevância dos trabalhos que foram utilizados na seleção do estudo, basearam-se em alguns aspectos qualitativos, como: periódicos com indexações e com conceitos
Qualis emitido pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES),
publicações que retratavam o assunto em questão como tema principal, sendo priorizadas as publicações mais recentes sobre o tema proposto.
Resultados
Nos testes paramétricos quando a hipótese nula é rejeitada, encontrando uma diferença estatisticamente significante, aceita-se, portanto, a hipótese alternativa. Neste caso, o método do teste de hipótese é composto por seis etapas sequenciais, listadas e descritas no Quadro 1.
Quadro 1 - Procedimentos do teste de hipótese.
Procedimentos do teste Descrição
Formular a hipótese nula. A hipótese nula é necessária para testar estatisticamente a significância.
Escolher o teste estatístico.
Para se testar uma hipótese, deve-se escolher um teste estatístico determinado. Existem pelo menos quatro critérios para determinar o teste apropriado: poder de eficiência do teste; como foi escolhida a amostra; natureza da população; tipo de escala de mensuração.
Selecionar o nível de significância.
A escolha do nível de significância deve ser feita antes da coleta de dados. O nível de significância escolhido está relacionado ao risco a que se deseja aceitar.
Computar o valor da diferença calculada. Depois de coletar os dados, utilizar a fórmula do teste escolhido e obter o valor calculado.
Obter o valor crítico do teste. Após obter o valor calculado, deve-se procurar o valor crítico de tabela.
Interpretar o teste.
Se o valor calculado for maior que o valor crítico, rejeita-se a hipótese nula. Complementarmente, se o valor calculado for menor que o valor de tabela, aceita-se a hipótese nula.
XXI Encontro Latino Americano de Iniciação Científica, XVII Encontro Latino Americano de Pós-Graduação e VII Encontro de Iniciação à Docência – Universidade do Vale do Paraíba. 3
No Quadro 2 é possível observar uma lista com alguns modelos de testes, com sugestões de utilização, tipos de escalas com que podem ser empregadas, suas respectivas fórmulas e observações.
Quadro 2 - Lista com alguns modelos de testes paramétricos que podem ser aplicados na experimentação agrícola. Testes paramétricos Utilização Escala e/ou variável Fórmula Teste F (ANOVA). Comparar as variâncias de dois ou mais grupos/amostras, com a finalidade de avaliar os possíveis efeitos de vários tratamentos. Uma variável, no mínimo, no nível de intervalo. 1 1 1 2 1 2 1 1 2 1 2 1 2 1 2 1
r r n r n n n r n r n n r n X n X n X X r n X n X r r "t" para medidas independentes ou com grupos não pareados. Avalia a diferença entre as médias de 2 grupos não pareados de tamanhos iguais ou diferentes. No mínimo, no nível de intervalo.
t X X X X n X X n n n n n 1 2 1 2 12 1 2 2 2 2 2 1 2 2 1 2 1 1 ( ) "t" para medidas repetidas ou com grupos pareados. Avalia a diferença entre as médias de 2 grupos pareados ou com medidas repetidas entre as amostras. No mínimo, no nível de intervalo.
X X d d n n n ou d d d n n n 1 2 2 2 2 2 1 1 ( ) ( ) "t" para uma amostra. Compara a média de 1 grupo (c/ n 30) c/ a média da sua população. No mínimo, no nível de intervalo: (peso em Kg ou altura em m), por exemplo. Índice de correlação de Pearson (r). Para estabelecer apenas uma possível associação entre duas amostras ou conjunto de dados. Intervalo.
r xy x y ONDE xy X X Y Y x y X X Y Y i i i i
2 2 2 2 2 2 . , ( ).( ) . . OMEGA2. Avaliar a possível significância científica de um resultado qualquer de pesquisa manipulativa. Intervalo.
r
T rn
F
gl
F
gl
1
1
1 1 2
Bartellet. Eficiente quando não rejeitamos a hipótese de normalidade dos dados. No mínimo, no nível de intervalo. B r S r S .log
log 2 2Fonte: Adaptado de (WONNACOTT; WONNACOTT, 1985; BUSSAB; MORETTIN, 1986; ROCHA; DELAMARO, 2011).
n S S n X X S X t X i X
XXI Encontro Latino Americano de Iniciação Científica, XVII Encontro Latino Americano de Pós-Graduação e VII Encontro de Iniciação à Docência – Universidade do Vale do Paraíba. 4
Alguns testes paramétricos que podem ser aplicados na experimentação agrícola podem ser classificados quanto à escala de mensuração de suas variáveis em paramétricos e não-paramétricos. Na Figura 1 é apresentado um esquema das formas de alguns testes de hipóteses paramétricas. Figura 1 - Formas de alguns testes de hipóteses paramétricas.
Fonte: Adaptado de (COOPER; SCHINDLER, 2003).
Além disso, baseando-se no nível de mensuração dos dados é possível escolher o teste para a comparação dos resultados obtidos. No Quadro 3 estão dispostas algumas sugestões dessas possíveis aplicações.
Quadro 3 - A escolha do teste para comparação de amostras.
Dados Amostras pareadas Amostra independentes
Nominal Teste dos sinais Qui-quadrado
Ordinal Dupla análise de variância de Friedman.
Teste da mediana (para duas amostras).
Análise da variância de Kruskal-Wallis (para mais de duas amostras.
Intervalar Teste t (student) Teste t (para duas amostras). Análise de variância (para mais amostras).
Discussão
Como demonstrado no Quadro 1, o método do teste de hipóteses é iniciado com um valor suposto (hipotético) de um parâmetro da população. Após a coleta de uma amostra aleatória, compara-se a estatística da amostra, tal como a média amostral, com o parâmetro suposto, tal como a média populacional hipotética. Assim, é aceito ou rejeitado o valor suposto como sendo correto. A rejeição do valor hipotético ocorre somente se o resultado da amostra for claramente improvável de ocorrer quando a hipótese for verdadeira (DONNARUMMA et al., 2017; LUBIANO et al., 2017; XIA; SUN, 2017; ZHOU et al., 2017).
Portanto, o teste de hipótese é um procedimento estatístico que averigua se os dados sustentam uma hipótese. Existem duas hipóteses:
• Hipótese nula: H0 • Hipótese alternativa: H1
XXI Encontro Latino Americano de Iniciação Científica, XVII Encontro Latino Americano de Pós-Graduação e VII Encontro de Iniciação à Docência – Universidade do Vale do Paraíba. 5
• Unilateral (unicaudal): H1 apenas contempla a possibilidade à direita ou à esquerda de H0. H0: μ = 1 vs H1: μ > 1 (unilateral à direita). H0: μ = 1 vs H1: μ < 1 (unilateral à esquerda).
• Bilateral (bicaudal): H1 contempla possibilidades à direita ou à esquerda de H0: H0: μ = 1 vs H1: μ ¹ 1 (bilateral).
Desta forma, existem duas possíveis decisões: • Rejeitar a hipótese nula H0
• Não rejeitar a hipótese nula H0
Portanto, esses testes de hipóteses estão relacionados aos testes bicaudal e unicaudal. Sendo que, o teste bicaudal considera que uma média pode ser inferior ou superior a um determinado valor. Neste teste, as zonas de rejeição são divididas em duas áreas. Enquanto, no teste bicaudal, a hipótese alternativa não é expressa direcionalmente. Já o teste unicaudal atribui toda a probabilidade de determinado resultado há uma extremidade. Assim, a hipótese alternativa é expressa direccionalmente (BISHOP et al., 2011; PEŘINA; KŘEPELKA, 2013; DÍEZ et al., 2017).
Neste caso, o pesquisador pode utilizar o teste de hipótese tanto para verificar associações quanto para verificar diferenças. Na primeira situação, a hipótese nula defende que não existe associação entre os dados testados no fenômeno em estudo. Na segunda situação, a hipótese nula defende que não existe diferença entre os dados testados. Ainda nesta segunda situação, podem-se verificar as diferenças entre distribuições, médias, proporções medianas ou postos (DONNARUMMA et al., 2017; ZHOU et al., 2017).
Como demonstrado na Figura 1, nos testes paramétricos supõem-se que ao menos uma variável em teste esteja medida em escala intervalar (métrica). Por outro lado, os testes não-paramétricos supõem que as variáveis estejam medidas em uma escala nominal ou ordinal (não-métrica). Além disso, os testes de hipóteses paramétricos são mais poderosos por quê seus dados são derivados de mensuração métrica (ROCHA; DELAMARO, 2011; LUBIANO et al., 2017; XIA; SUN, 2017).
Nota-se no Quadro 2 uma lista com alguns modelos de testes paramétricos que podem ser aplicados na experimentação agrícola, nota-se a existência de uma vasta gama de possibilidades, o que gera dúvidas em relação a qual modelo aplicar, necessitando que o pesquisador tenha uma base de conhecimentos que permita uma análise crítica e eficiente dos dados obtidos e qual a forma de testá-los, o que requer familiaridade com a estatística, demonstrando a importância de trabalhos como este, que buscam esclarecer e auxiliar na aplicação da estatística paramétrica na experimentação agrícola.
No Quadro 3 é possível verificar que o nível nominal de mensuração é caracterizado por dados que consistem apenas em nomes, rótulos ou categorias (YANG et al., 2011; GROVER et al., 2017). Os dados não podem ser dispostos segundo um esquema ordenado (como de baixo para cima). Por exemplo:
• Respostas do tipo “sim”, “não” ou “indeciso”.
• O sexo dos estudantes em uma turma de estatística. • Número no conselho de psicologia.
Enquanto o nível ordinal de mensuração envolve dados que podem ser dispostos em alguma ordem, mas as diferenças entre os valores dos dados não podem ser determinadas, ou não tem sentido. Por exemplo:
• Um editor classifica alguns originais como “excelentes”, alguns como ‘‘bons” e alguns como “maus” (não podemos determinar uma diferença quantitativa entre “bom” e “mau”).
• Um comitê de preparação olímpica classifica A em 3º lugar, B em 8º lugar e C em 10º lugar (podemos determinar a diferença entre 3º e 8º, mas a diferença 5 não tem qualquer significado).
• Graus finais (A, B, C, D) de estudantes de estatística. Sendo que, os dados em nível ordinal não devem ser utilizados em cálculos.
XXI Encontro Latino Americano de Iniciação Científica, XVII Encontro Latino Americano de Pós-Graduação e VII Encontro de Iniciação à Docência – Universidade do Vale do Paraíba. 6
Ainda no Quadro 3, nota-se que o nível intervalar de mensuração é análogo ao nível ordinal, com a propriedade adicional de que podemos determinar diferenças significativas entre os dados. Todavia, não existe um ponto de partida zero inerente, ou natural (onde não haja qualquer quantidade presente). Por exemplo:
• Os anos 1000, 2000, 1796 e 1945 (o tempo não começou no ano zero e, assim o zero é arbitrário, e não um ponto de partida zero natural).
• As temperaturas anuais médias (em graus Celsius) das capitais dos estados brasileiros. Desta forma, baseando-se no nível de mensuração dos dados, é possível escolher de forma mais confiável o teste adequado a ser aplicado para realizar uma comparação eficiente e mais exata dos resultados obtidos na experimentação agrícola (DONNARUMMA et al., 2017; LUBIANO et al., 2017; XIA; SUN, 2017; ZHOU et al., 2017).
Conclusão
O entendimento dos princípios básicos da experimentação é de suma importância para a escolha e aplicação do método mais adequado para se obter dados confiáveis, auxiliando na tomada de decisões quanto a sua aplicação na experimentação agrícola.
Quando realizada sem critérios técnicos e se ignorado os princípios metodológicos da experimentação, os dados obtidos poderão ser comprometidos e neste caso, obrigatoriamente, os mesmos devem ser descartados e o experimento refeito.
Referências
BISHOP, J. D. K. et al. Using non-parametric statistics to identify the best pathway for supplying hydrogen as a road transport fuel. International Journal of Hydrogen Energy. V.36, n.15, p.382-395, 2011.
BUSSAB, W. O.; MORETTIN, P. A. Estatística Básica. 3ª ed. São Paulo: Editora Atual, 1986. 457p. COOPER, D. R.; SCHINDLER, P. S. Métodos de pesquisa estatística. 7a ed. Trad.: ROCHA, L. O. Porto Alegre: BOOKMAN, 2003. 298p.
DÍEZ, J.; URIARTE, A.; MEDINA, R. A parametric model for the dry beach equilibrium profile. Journal of
Coastal Research. V.1, p.134-144, 2017.
DONNARUMMA, F. et al. Action perception as hypothesis testing. Cortex. V.89, p.45-60, 2017.
GROVER, N. et al. Influence of parametric uncertainties on the deflection statistics of general laminated composite and sandwich plates. Composite Structures. V.171, p.158-169, 2017.
HU, L. A note on order statistics-based parametric pattern classification. Pattern Recognition. V.48, n.1, p.43-49, 2015.
LUBIANO, M. A. et al. Hypothesis testing-based comparative analysis between rating scales for intrinsically imprecise data. International Journal of Approximate Reasoning. V.88, p.128-147, 2017.
PEŘINA, J.; KŘEPELKA, J. Quantum statistics of optical parametric processes with squeezed reservoirs.
Optics Communications. V.308, p.274-281, 2013.
ROCHA, H. M.; DELAMARO, M. C. Abordagem metodológica na análise de dados de estudos não-paramétricos, com base em respostas em escalas ordinais. Gestão da Produção, Operações e
Sistemas. V.1, p.34-42, 2011.
TUCKMAN, B. Manual de Investigação em Educação. Lisboa: Fundação Calouste Gulbenkian. 2000. WONNACOTT, R. J.; WONNACOTT, T. Fundamentos de Estatística. Livros Técnicos e Científicos. Rio de Janeiro: Editora S. A., 1985. 321p.
XIA, Y.; SUN, J. Hypothesis testing and statistical analysis of microbiome. Genes & Diseases. V.1, p.1-11, 2017.
YANG, X. et al. Biological parametric mapping with robust and non-parametric statistics. NeuroImage. V.57, n.2, p.423-430, 2011.
ZHOU, B.; GUO, J.; ZHANG, J. T. High-dimensional general linear hypothesis testing under heteroscedasticity. Journal of Statistical Planning and Inference. V.188, p.36-54, 2017.