• Nenhum resultado encontrado

5.2 Adequação dos testes paramétricos

5.2.1 Análise da normalidade

A análise de normalidade dos grupos formados na secção 4.4.2, baseia-se, numa primeira fase, na observação gráfica conjunta da função densidade de probabilidade estimada da variável produtividade para cada grupo de gestão, e posteriormente, para a confirmação dos resultados, procedeu-se à aplicação de testes de Normalidade. Assim com recurso ao software R, foram obtidos os gráficos das estimativas das funções densidades de probabilidade referentes à variável produtividade nos cinco grupos de gestão formados (figura 5.5 e figuras 4 e 5 do Anexo D.3). A sua construção permite refletir os padrões gerais da função densidade de probabilidade que se objetiva estudar na presente subsecção, sendo que, a sua análise se prende com a necessidade de colocar em evidencia a existência ou inexistência de tendências de Normalidade inerentes aos grupos em estudo.

Figura 5.5: Esboço da função densidade estimada da variável produtividade para os cinco grupos de gestão formados.

A curva da função densidade de probabilidade da distribuição Normal caracteriza-se por ser simétrica, possuindo a forma de sino. A partir das representações gráficas da função densidade de probabilidade estimada da variável produtividade nos diferentes grupos, é plausível indagar que apenas as curvas referentes à função densidade de probabilidade estimada dos grupos de parcelas geridas pelas entidades A e B evidenciam simetria (aproximada), visto que ambas possuem uma forma aproximadamente semelhante a um sino.

Com o auxílio do software R, fez-se uso das funções ‘qqplot()’ e ‘hist()’, as quais permitiram obter, respetivamente, o qqplot e os histogramas, para a variável produtividade, para cada um dos grupos formados na secção 4.4.2, por forma a inferir visualmente, de forma mais detalhada, quanto à Normalidade da variável produtividade em cada grupo. Seguidamente implementaram-se os testes de normalidade aplicados aos grupos de dados estabelecidos na sec- ção 4.4.2, por forma a comprovar os resultados obtidos pelas representações gráficas elaboradas anteriormente. Nesse sentido recorreram-se aos testes: Shapiro-Wilk, Anderson-Darling e teste de Kolmogorov-Smirnov com correção de Lilliefords. Note-se que neste caso o teste de Kolmogorov-Smirnov (sem correção de Lilliefords) considerou-se desadequado tendo em conta que os valores da média e do desvio padrão associados à amostra em estudo eram desconhecidos. A escolha dos testes de Normalidade aplicados baseou-se nas características inerentes ao conjunto de dados em estudo e na adequação dos respetivos testes à dimensionali- dade e às características dos mesmos. A aplicação conjunta dos testes mencionados permite comprovar os resultados obtidos individualmente. Recorrendo ao software R, faz-se uso das funções ‘shapiro.test()’, ‘ad.test()’ e ‘lillie.test()’, respetivamente.

Salienta-se, por fim, a necessidade de submeter à avaliação da Normalidade todas as categorias e subamostras sujeitas à análise e não apenas a amostra global, atendendo a que em estudos subsequentes se pretende analisar e efetuar comparações múltiplas entre os subgrupos de parcelas geridas e não geridas e entre os subgrupos formados.

Primeiramente, far-se-á uma análise ao grupo de parcelas geridas pertencentes à entidade A, cujo grupo é formado por um número reduzido de parcelas: oito.

Os dois gráficos obtidos com recurso ao software R - qqplot e o histograma - referentes à variável produtividade para o grupo de parcelas geridas pertencentes à entidade A, permitem intuir a existência de Normalidade nos dados. Com efeito, os valores dos quantis calculados a partir da amostra dos dados relativos à produtividade das parcelas geridas pela entidade A aproximam-se dos quantis teóricos da distribuição Normal para a presente amostra, na medida em que os pontos (valores empíricos) se aproximam da reta do qqplot (valores teóricos da distribuição Normal). Também em relação ao histograma, verifica-se que existe um pico de frequências, e uma distribuição aproximadamente simétrica das restantes barras em torno desse pico, sendo plausível indagar a aproximação do histograma à curva a vermelho relativa aos valores teóricos da distribuição Normal.

Figura 5.6: À esquerda encontra-se representado o qqplot, e à direita o histograma e respetiva curva da distribuição Normal, relativos à função densidade da variável produtividade no grupo de parcelas geridas pertencentes à entidade A.

A conjetura apresentada requer confirmação recorrendo a testes de hipóteses de Normalidade, não só devido à falta de precisão e rigor inerentes às representações gráficas, mas também devido à reduzida dimensionalidade do grupo em estudo, o qual é formado apenas por 8 parcelas.

A hipótese nula dos testes aplicados pressupõe a existência de Normalidade da variável produtividade relativamente ao grupo de parcelas geridas pertencentes à entidade A. Assim, a um nível de significância de 5%, todos os testes aplicados corroboram a não rejeição da hipótese nula, o que está de acordo com as conclusões indagadas graficamente. Conclui-se, assim, a existência de Normalidade da variável produtividade relativamente ao grupo das parcelas geridas pertencentes à entidade A.

Tabela 5.6: Resultados dos testes de Normalidade para o grupo de parcelas geridas pertencentes à entidade A, relativamente à sua produtividade.

p-value Decisão (α = 0.05) Teste de Shapiro-Wilk 0.338 Não rejeitar normalidade Teste de Anderson-Darling 0.307 Não rejeitar normalidade

Teste de KS

com correção de lilliefors 0.538 Não rejeitar normalidade

Analogamente, os resultados obtidos para os restantes grupos de gestão formados são apresentados seguidamente.

No que infere às representações gráficas apresentadas, de forma análoga ao que foi explanado anteriormente, permitem conjeturar a aproximação à distribuição Normal no que infere ao grupo de parcelas geridas cuja entidade responsável é a entidade B. Por outro lado, o afastamento evidenciado entre os qqplots e os histogramas empíricos das respetivas representações teóricos, permitem supor a falta de Normalidade dos restantes grupos de parcelas. As representações gráficas encontram-se na figura 5.7.

(a) Geridas entidade B. (b) Grupo entidade C.

(c) Não Geridas entidade A. (d) Não geridas entidade B

Figura 5.7: Qqplot, e histograma relativos à função densidade estimada da variável produtividade nos respetivos grupos de gestão formados.

Por forma a comprovar os resultados conjeturados graficamente, são implementados testes de Normalidade, nomeadamente os testes de Shapiro-Wilk, Anderson-Darling e KS com correção de Lilliefors, cujos resultados se encontram sintetizados na tabela 5.7.

Tabela 5.7: Resultados dos testes de Normalidade para os grupos de gestão formados, relativa- mente à variável produtividade.

p-value Decisão (α = 0.05)

Geridas Entidade

B

Teste de Shapiro-Wilk 0.921 Não rejeitar normalidade Teste de Anderson-Darling 0.765 Não rejeitar normalidade

Teste de KS com

correção de lilliefors 0.430 Não rejeitar normalidade

Geridas C

Teste de Shapiro-Wilk 0.0004 Rejeitar normalidade Teste de Anderson-Darling 0.0003 Rejeitar normalidade

Teste de KS com

correção de lilliefors 0.012 Rejeitar normalidade

Não Geridas Entidade

A

Teste de Shapiro-Wilk 0.008 Rejeitar normalidade Teste de Anderson-Darling 0.006 Rejeitar normalidade

Teste de KS com

correção de lilliefors 0.047 Rejeitar normalidade

Não Geridas Entidade

B

Teste de Shapiro-Wilk 0.002 Rejeitar normalidade Teste de Anderson-Darling 0.001 Rejeitar normalidade

Teste de KS com

correção de lilliefors 0.009 Rejeitar normalidade

Note-se que o grupo de parcelas geridas pertencentes à entidade C possui 377 parcelas, pelo que neste caso o teste de Shapiro-Wilk não se considera adequado tendo em conta a elevada dimensionalidade inerente ao grupo supracitado. Por outro lado, sendo o grupo de parcelas não geridas pertencentes à entidade B formado por 19 parcelas, o teste que melhor se coaduna com a dimensionalidade inerente aos dados é o teste de Shapiro-Wilk, apesar dos resultados dos restantes testes aplicados permitirem obter resultados semelhantes.

Os resultados dos testes de Normalidade permitem assim concluir, a um nível de sig- nificância de 5% a não rejeição da hipótese de Normalidade no grupo de parcelas geridas pertencentes à entidade B. Não obstante, relativamente ao mesmo nível de significância, os testes implementados permitem rejeitar a hipótese de Normalidade nos grupos de parcelas geridas pela entidade C, e nos grupos de parcelas não geridas pertencentes às entidades A e B.