• Nenhum resultado encontrado

Correla¸c˜ ao Polic´ orica

A correla¸c˜ ao polic´ orica ´ e uma medida de associa¸c˜ ao bivariada para dados qualitativos ordinais.

Suponha que C e D sejam duas vari´ aveis qualitativas ordinais relacionadas com as vari´ aveis latentes cont´ınuas X e Y por meio de

C = c

i

, se γ

i−1

6 X < γ

i

, i = 1, ..., r;

17

Assumimos que a distribui¸c˜ ao conjunta das vari´ aveis latentes cont´ınuas X e Y seja a normal padr˜ ao bivariada com coeficiente de correla¸c˜ ao ρ, cuja fun¸c˜ ao de densidade conjunta ´ e

Dada uma amostra das vari´ aveis qualitativas ordinais C e D, tais observa¸c˜ oes s˜ ao classificadas em uma das categorias definidas por [γ

i−1

, γ

i

) × [τ

j−1

, τ

j

), i = 1, . . . , r e j = 1, . . . , s, cujas categorias (combina¸c˜ oes das parti¸c˜ oes de X e Y ) determinam uma tabela de contingˆ encia.

Ent˜ ao, considerando o vetor de vari´ aveis aleat´ orias (N

11

, N

12

, . . . , N

rs

)

t

, em que N

ij

, i = 1, . . . , r e j = 1, . . . , s, indica o n´ umero de vezes que uma observa¸c˜ ao ´ e classificada na casela (i, j) da tabela de contingˆ encia, explicada anteriormente, com probabilidade p

ij

, (N

11

, N

12

, . . . , N

rs

)

t

possui distribui¸c˜ ao multinomial com parˆ ametros n, p

11

, p

12

, . . . , p

rs

, cujo tamanho amostral ´ e n =

r

categorias c

i

e d

j

, respectivamente, das vari´ aveis C e D.

Logo, dada uma amostra de tamanho n de (C, D), a fun¸c˜ ao de verossimilhan¸ca ´ e dada por:

Para encontrarmos o estimador de m´ axima verossimilhan¸ca de ρ, precisamos maxi-mizar o logaritmo da fun¸c˜ ao de verossimilhan¸ca (3.5), denotado por l, em rela¸c˜ ao aos parˆ ametros do modelo. Cox (1974) e Olsson et al. (1982) apresentam as derivadas de l em fun¸c˜ ao de todos os parˆ ametros do modelo.

Derivando (3.5) em rela¸c˜ ao a ρ e igualando a zero, obtemos

∂l

A raiz da Equa¸c˜ ao (3.6), que ´ e a estimativa da correla¸c˜ ao polic´ orica, ´ e obtida via m´ etodos num´ ericos.

Um dos m´ etodos utilizados para maximizarmos L ´ e o denominado estimativa de 2 pas-sos (Martinson e Hamdan, 1972), que consiste em encontrarmos os limiares no primeiro passo para, posteriormente, obtermos ρ que maximize o logaritmo da fun¸c˜ ao de verossi-milhan¸ca (3.5). O valor de ρ que maximiza a fun¸c˜ ao de verossimilhan¸ca ´ e a estimativa da correla¸c˜ ao polic´ orica.

O primeiro passo consiste em obtermos os limiares γ

i

e τ

j

da seguinte forma:

ˆ

P

·j?

s˜ ao as propor¸c˜ oes marginais acumuladas, perfil linha e perfil coluna, dadas,

respecti-vamente, por

Cap´ıtulo 4

Aplica¸ c˜ ao em dados quantitativos

4.1 An´ alise Fatorial Explorat´ oria

Como descrito nos cap´ıtulos anteriores, a An´ alise Fatorial Explorat´ oria (AFE) ´ e uma t´ ecnica estat´ıstica multivariada proposta, inicialmente, para dados quantitativos. Assim, neste cap´ıtulo, faremos uma breve ilustra¸c˜ ao da aplica¸c˜ ao da t´ ecnica usual, que servir´ a como base para a aplica¸c˜ ao em dados ordinais, apresentada no pr´ oximo cap´ıtulo.

Para exemplificar, utilizaremos dados referentes a recordes femininos em 54 pa´ıses, apresentados em Richard (2007). As vari´ aveis V 2 a V 8 dizem respeito ao tempo de conclus˜ ao das provas realizadas, respectivamente: 100 metros (medido em segundos), 200 metros (medido em segundos), 400 metros (medido em segundos), 800 metros (medido em minutos), 1500 metros (medido em minutos), 3000 metros (medido em minutos) e maratona (medido em minutos).

O objetivo ´ e reduzir a dimensionalidade das vari´ aveis atrav´ es de um n´ umero reduzido de fatores comuns, obtendo o m´ aximo de informa¸c˜ ao. Deste modo, nosso interesse ´ e inferir, atrav´ es do nosso conjunto de dados, um n´ umero apropriado de fatores e os valores dos coeficientes nas equa¸c˜ oes do modelo de fator comum.

Vale ressaltar que todos os resultados para as an´ alises foram obtidos por meio do software R.

Inicialmente, na Tabela 4.1, calculamos a matriz de correla¸c˜ oes de Pearson.

Tabela 4.1: Matriz de correla¸c˜ ao de Pearson.

Podemos observar que as vari´ aveis que possuem os maiores valores da correla¸c˜ ao de Pearson s˜ ao: V 2 e V 3; V 3 e V 4; V 5 e V 6; V 6 e V 7. Al´ em disso, as correla¸c˜ oes entre as vari´ aveis s˜ ao todas positivas e variam entre 0, 63 e 0, 97, ou seja, todas as correla¸c˜ oes s˜ ao maiores que 0, 3, indicando que a AF ´ e uma t´ ecnica adequada aos dados.

Para verificarmos se a AF ´ e realmente adequada, conduziremos dois testes: KMO (Equa¸c˜ ao 2.3) e MSA (Equa¸c˜ ao 2.4). Os resultados obtidos est˜ ao dispon´ıveis na Tabela 4.2.

Tabela 4.2: Teste de adequacidade: KMO e estat´ıstica MSA.

KMO = 0,82

V2 V3 V4 V5 V6 V7 V8

0,89 0,78 0,86 0,85 0,74 0,76 0,88

Nota-se que o valor do KMO ´ e 0,82, superior a 0,8, indicando que a an´ alise fatorial ´ e

adequada aos dados. Al´ em disso, nota-se que a estat´ıstica MSA, para todas as vari´ aveis,

s˜ ao superiores a 0,5, indicando que todas elas contribuem para o m´ etodo abordado, ou

seja, que este modelo ´ e adequado.

21

Deste modo, as cargas fatoriais e as variˆ ancias espec´ıficas podem ser estimadas atrav´ es dos componentes principais, decompondo a matriz de correla¸c˜ oes.

Tabela 4.3: Autovalores e propor¸c˜ ao da variˆ ancia total explicada.

Fatores Autovalores Propor¸c˜ ao da variabilidade Propor¸c˜ ao acumulada

1 5,808 0,830 0,830

2 0,629 0,090 0,919

3 0,279 0,040 0,959

4 0,125 0,018 0,977

5 0,091 0,013 0,990

6 0,055 0,008 0,998

7 0,014 0,002 1,000

Figura 4.1: Scree Plot.

Observa-se, pela Figura 4.1 e pela Tabela 4.3, que o n´ umero ideal de fatores ´ e dois, que s˜ ao respons´ aveis por explicar 91,9% da variabilidade total dos dados. Al´ em disso, nota-se que n˜ ao h´ a um aumento muito significativo na variabilidade explicada ao acrescentarmos um terceiro fator. Sendo assim, conduziremos a an´ alise considerando apenas 2 fatores.

Obtendo-se os autovalores e autovetores por meio da decomposi¸c˜ ao espectral da matriz de correla¸c˜ oes, as cargas fatoriais s˜ ao estimadas, conforme a Equa¸c˜ ao (2.5). Na Tabela 4.4 s˜ ao mostradas as estimativas das cargas fatoriais ainda n˜ ao rotacionadas, as quais representam a correla¸c˜ ao entre as vari´ aveis e os fatores. Nesta aplica¸c˜ ao, especificamente, todas as vari´ aveis s˜ ao altamente correlacionadas com o primeiro fator, dificultando a interpreta¸c˜ ao do segundo.

Deste modo, visando a interpreta¸c˜ ao, precisaremos fazer uma rota¸c˜ ao dos nossos fa-tores, com objetivo de redistribuir a variˆ ancia do primeiro fator comum para o segundo.

Tabela 4.4: Cargas fatoriais n˜ ao rotacionadas.

Vari´ aveis Fator 1 Fator 2

V2 -0,91 -0,32

Por´ em, antes de rotacionarmos os fatores, estimamos as comunalidades, conforme

des-crito pela Equa¸c˜ ao (2.6). A Tabela 4.5 apresenta tais valores, observando que, com o

modelo fatorial com dois fatores comuns, conseguimos explicar mais de 80% da

variabili-dade de cada uma das vari´ aveis.

23 Tabela 4.5: Comunalidades.

V2 V3 V4 V5 V6 V7 V8

0,93 0,96 0,92 0,92 0,94 0,93 0,83

No Cap´ıtulo 2 abordamos alguns m´ etodos para a rota¸c˜ ao dos fatores, mas para esta an´ alise, utilizamos a rota¸c˜ ao VARIMAX, obtendo os resultados mostrados na Tabela 4.6.

Tabela 4.6: Cargas fatoriais rotacionadas.

Vari´ aveis Fator 1 Fator 2

V2 -0,43 -0,86

Note que, ap´ os a rota¸c˜ ao dos fatores, as cargas fatoriais foram “redistribu´ıdas” entre os fatores comuns, ou seja, h´ a uma separa¸c˜ ao mais n´ıtida entre as vari´ aveis com rela¸c˜ ao aos fatores.

Portanto, podemos atribuir nomes aos nosso fatores de acordo com as vari´ aveis que

est˜ ao relacionadas a elas. Consultando os nomes das vari´ aveis, podemos denotar o

pri-meiro fator comum como sendo desempenho em provas de distˆ ancias mais longas,

englobando as vari´ aveis: V 5, V 6, V 7 e V 8. Em contra partida, podemos denotar o

se-gundo fator comum como sendo desempenho em provas de distˆ ancias mais curtas,

englobando as vari´ aveis: V 1, V 2 e V 3.

Cap´ıtulo 5

Aplica¸ c˜ ao em dados ordinais

A Comiss˜ ao Pr´ opria de Avalia¸c˜ ao (CPA) da Universidade Federal de S˜ ao Carlos (UFS-Car) atua coordenando os processos internos de autoavalia¸c˜ ao, atendendo a Lei n º 10.861, de 14 de abril de 2004, que instituiu a Avalia¸c˜ ao da Educa¸c˜ ao Superior (SINAES), cujo ob-jetivo ´ e avaliar as institui¸c˜ oes e cursos, envolvendo o corpo docente, discentes e servidores t´ ecnico-administrativos da universidade.

Cada institui¸c˜ ao de ensino possui a sua Comiss˜ ao Pr´ opria de Avalia¸c˜ ao para coordenar os processos avaliativos.

A CPA faz levantamentos de dados e informa¸c˜ oes relevantes para auxiliar o aprimo-ramento das quest˜ oes relacionadas ao processo de planejamento e gest˜ ao, produ¸c˜ ao de conhecimento e da extens˜ ao, identificando potencialidades e fragilidades, auxiliando na tomada de decis˜ ao.

Neste cap´ıtulo ser˜ ao aplicadas as alternativas da an´ alise fatorial para dados qualitati-vos, conforme apresentadas no Cap´ıtulo 3. A aplica¸c˜ ao ser´ a feita no conjunto de dados da Comiss˜ ao Pr´ opria de Avalia¸c˜ ao (CPA), na qual os dados s˜ ao de natureza qualitativa ordinal.

Para o c´ alculo das estimativas das cargas fatoriais e comunalidades, utilizaremos o m´ etodo dos componentes principais e, para facilitar a interpreta¸c˜ ao das cargas fatoriais, utilizaremos o m´ etodo de rota¸c˜ ao Varimax nos fatores.

5.1 Banco de dados

Os dados utilizados foi fornecido pela pela CPA, cuja coleta foi realizada atrav´ es de

formul´ arios contendo, em sua maioria, quest˜ oes em escala Likert, variando nas pontua¸c˜ oes

de 1 a 5. O intuito ´ e medir o grau da intensidade associada a cada quest˜ ao, sendo que, quanto ´ e maior o valor do r´ otulo, maior a concordˆ ancia. Al´ em disso, em algumas quest˜ oes, a escala cont´ em o n´ umero 6 a fim de indicar que o respondente n˜ ao possui conhecimento sobre a quest˜ ao ou condi¸c˜ oes necess´ arias para responder.

A pesquisa aplicada em 2019 possui 14 quest˜ oes contendo v´ arios itens (contabilizando 150 no total), na qual foram coletadas 1326 observa¸c˜ oes.

Selecionamos algumas vari´ aveis, especificamente 64 dos 150 itens originais, seguindo dois principais crit´ erios: as vari´ aveis precisavam ser de natureza qualitativa ordinal (ou seja, medida em escala do tipo Likert ) e conter menos de 50% de respostas no r´ otulo 6 (presente na escala).

Deste modo, as vari´ aveis selecionadas s˜ ao denotadas por: dis q1a, dis q1b, dis q1c, dis q1d, dis q1e, dis q1f, dis q1g, dis q1h, dis q4a, dis q4b, dis q4c, dis q4d, dis q4e, dis q4f, dis q4g, dis q4h, dis q4i, dis q8a, dis q8b, dis q8c, dis q8d, dis q8e, dis q8f, dis q9a, dis q9b, dis q9c, dis q9d, dis q9e, dis q9f, dis q9g, dis q10a, dis q10b, dis q10c, dis q10d, dis q10e, dis q10f, dis q10g, dis q10h, dis q10i, dis q10j, dis q10k, dis q10l, dis q10m, dis q10n, dis q10o, dis q10p, dis q10q, dis q10r, dis q13a, dis q13b, dis q13c, dis q13e, dis q14a, dis q14b, dis q14c, dis q14d, dis q14e, dis q14f, dis q14g, dis q14h, dis q14i, dis q14j, dis q14k, dis q14l.

O formul´ ario aplicado e, consequentemente, a descri¸c˜ ao de cada uma das quest˜ oes encontram-se na p´ agina oficial da CPA - UFSCar em:

https://www.cpa.ufscar.br/arquivos/instrumentos-de-autoavaliacao/questionario-discente-revisado-2018.pdf.

Note que, por exemplo, as vari´ aveis dis q1a e dis q1b referem-se ao item a e b da

Quest˜ ao 1, respectivamente.

Documentos relacionados