• Nenhum resultado encontrado

Descrição e apresentação dos dados e análise da influência de características das escolas

delimitação conceitual

5. fontes de dados, medidas e procedimentos analíticos

4.3. Procedimentos analíticos

4.3.1. Descrição e apresentação dos dados e análise da influência de características das escolas

Esta etapa busca captar melhor a informação fornecida pelas medidas das condições de trabalho docente nas escolas e dos seus fatores associados. A variável de contexto foi desconsiderada nessa etapa, pois o conhecimento mais aprofundado da situação socioeconômica das escolas não constitui interesse central desta tese. Nesse intuito, realizou-se a descrição e a apresentação dos dados, consideradas uma etapa preliminar da análise estatística. Foi feita a representação gráfica da distribuição dos dados de cada medida analisada e foram utilizadas medidas de tendência central (média, mediana) e de variabilidade (mínimo, máximo, quartis, variância, desvio-padrão).

Em seguida passou-se à análise bivariada das medidas. O propósito foi o de verificar se características das unidades educacionais exerciam – ou não – influência no conjunto de medidas analisadas. As características das escolas consideradas foram: dependência administrativa; etapa da educação básica; porte do estabelecimento; e localização.

Ressalte-se, portanto, a diferença metodológica existente ao analisar dados populacionais e dados amostrais. Nas medidas censitárias, a análise se restringe à descrição dos resultados das medidas segmentados de acordo com cada subgrupo de escolas. Esse é o caso das medidas produzidas com base nos dados do Censo Escolar e da Prova Brasil. Por outro lado, a análise de dados amostrais – como ocorre com as

medidas extraídas da pesquisa TDEBB – exige a aplicação de testes estatísticos. Faz emergir os conceitos de estatística inferencial, voltados a produzir estimativas sobre os parâmetros da população por meio de dados amostrais. A técnica estatística utilizada para atestar a existência de diferenças nas medidas pesquisadas em função de características dos estabelecimentos foi a análise de variância, explicitada a seguir.

 Análise de Variância

A análise de variância (Anova) é uma técnica estatística utilizada para realizar a comparação entre as médias de diferentes subgrupos. De acordo com Werkema e Aguiar (1996, p. 54), por meio dela “poderemos decidir se as diferenças observadas entre mais de duas medidas amostrais podem ser atribuídas ao acaso, ou se de fato existem diferenças entre as médias das populações correspondentes”. Em outras palavras, trata-se de um método inferencial para comparar várias médias. O motivo da técnica estatística ser denominada análise de variância e não análise de média, conforme argumentou Triola (2008, p. 508), deve-se ao fato de que “o termo análise de variância se refere ao método que usamos, que se baseia na análise das variâncias amostrais”.

Utilizou-se a Anova de um fator (ou fator único) “porque usamos uma única propriedade, ou característica, para categorizar as populações” (Triola, 2008, p. 509). Sobre a natureza dos dados, a variável resposta é contínua e os fatores (ou tratamentos) são variáveis categóricas. Nesta tese, as variáveis respostas foram as medidas das condições de trabalho docente nas escolas ou a elas relacionadas. Os fatores consistiram nas seguintes características dos estabelecimentos: porte das escolas; etapa exclusiva de atendimento; e dependência administrativa.

A aplicação da Anova exige o cumprimento de três suposições: 1) para cada grupo, a distribuição da variável resposta deve ser Normal; 2) o desvio-padrão da distribuição deve ser a mesma entre os grupos (homocedasticidade); e 3) as amostras retiradas da população devem ser aleatórias e independentes.

A adequação de um conjunto de dados às suposições da Anova demanda procedimentos analíticos específicos. A primeira suposição – a de normalidade – pode ser atestada por meio do Teste de Kolmogorov-Smirnov, que testa a hipótese nula de que os dados seguem distribuição Normal. A suposição de homocedasticidade pode ser avaliada com base nos resultados do Teste de Levene, que verifica a homogeneidade de

variâncias entre os grupos. Nesse teste, a hipótese estatística nula é que existe igualdade entre as variâncias dos grupos pesquisados. A terceira e última suposição relaciona-se à independência, em que uma observação não pode influenciar a(s) outra(s), e à aleatoriedade, ou seja, à inexistência de vício de seleção. Tal suposição se encontra assegurada a priori em decorrência do procedimento de coleta de dados utilizado (Seção 4.1) e também por não se tratar de situações experimentais, de medidas repetidas ou de dados longitudinais.

Na Anova, as hipóteses estatísticas são as seguintes: H0: µ1 = µ2 = ... = µg

H1: pelo menos duas das médias populacionais são diferentes

Sendo g correspondente ao número de grupos avaliados, a hipótese nula é de que as médias da variável resposta são iguais entre todos os grupos. Por sua vez, a hipótese alternativa é que existe diferença entre as médias de pelo menos um dos grupos.

A decisão sobre aceitar ou rejeitar a hipótese nula se encontra amparada no cálculo da estatística F. Conforme salientaram Agresti e Finlay (2012, p. 411), “[o] ponto principal dessa análise é o teste de significância, usando a distribuição F para detectar as diferenças entre um conjunto de médias populacionais”. Essa estatística é calculada pela razão entre dois tipos de variância da variável dependente: a variância entre grupos ou tratamentos, estimada pelo Quadrado Médio Entre Tratamentos (QME); e a variância dentro de grupos ou residual, estimada pelo Quadrado Médio Residual (QMR) (Tabela 13). A ideia central é que, caso a variação dos dados seja proveniente em maior medida entre os grupos ou tratamentos, afirma-se existir diferenças entre os grupos (rejeita-se a hipótese nula). Por outro lado, se a maior fonte de variação originar dentro dos grupos, as evidências apontam a aceitação da hipótese nula de que não existe diferença entre os grupos.

Tabela 13 – Análise de variância para um fator

Fonte de variação Soma dos

Quadrados

Graus de Liberdade

Quadrado Médio F0

Entre Tratamentos SQE k – 1 QME F0 = 𝑄𝑀𝐸

𝑄𝑀𝑅

Residual SQR k (n – 1) QMR

Total SQT kn - 1

É necessário, de antemão, estipular o nível de siginificância do teste estatístico (α), referente ao Erro Tipo I, ou seja, à probabilidade de se rejeitar a hipótese nula quando na verdade deveria ser aceita. Em outras palavras, equivale a concluir que as médias são significativamente diferentes sendo que elas são iguais. Os valores geralmente especificados para o nível de significância são 0,01, 0,05 ou 0,10. Nesta tese, o α estipulado foi de 0,05, o que significa existir 5% de chances de admitirmos haver diferenças entre grupos quando na verdade tais diferenças não se verificam.

A regra de decisão sobre rejeitar ou aceitar a hipótese nula consiste em compar a estatística F encontrada e o valor de referência na referida distribuição. O valor da distribuição F, sob o nível de significância de 0,05, corresponde a 3,84. Caso a estatística F estimada seja superior a esse valor, conclui-se existir diferença entre os grupos. Outra possibilidade de tomar essa decisão refere-se à comparação do nível de significância com a probabilidade de significância da amostra (Sig.), também conhecida por valor-p. Essa medida consiste na probabilidade de se obter uma estatística de teste igual ou mais extrema que aquela observada em uma amostra. Nesta tese, quando a probabilidade de significância for menor que 0,05, rejeita-se a hipótese nula, ou seja, conclui-se existir diferença entre as médias da variável dependente.

Porém, ao rejeitar H0, permite-se afirmar que ao menos um dos grupos possui

média diferente. Todas as médias populacionais, algumas delas ou somente uma média pode diferir das demais. A estratégia adotada para verificar as diferenças entre grupos foi o estabelecimento de intervalos de confiança para cada grupo. Ao comparar dois grupos, caso ocorra a sobreposição dos intervalos, conclui-se pela inexistência de diferenças. Por outro lado, se os intervalos não se sobrepuserem, afirma-se existir diferenças médias entre eles. Os intervalos foram produzidos com 95% de confiança, o que representa um nível de significância de 0,05.

Hipoteticamente, considerem os intervalos de confiança da taxa de retenção

dos professores variando de 0,08 a 0,12 para as escolas de educação infantil e de 0,13 a

0,16 para as do ensino médio. Ao comparar os intervalos, não existe sobreposição de valores, o que permite afirmar que a média da taxa de retenção dos professores no ensino médio é superior à da educação infantil. Caso a medida do ensino médio ficasse estabelecida no intervalo 0,11 – 0,15, a conclusão seria de igualdade de médias entre os grupos.

4.3.2. Estabelecimento de modelos analíticos das condições de trabalho docente