• Nenhum resultado encontrado

4.3 Metodologia

4.3.2 O método Grade of Membership

conceitual dos principais pontos. O leitor interessado em um maior aprofundamento matemático, pode consultar a referência.

Prosseguindo, para aplicação do GoM, é necessário o conhecimento de I observações (estudantes de Economia) sobre J variáveis, cada qual contendo um número finito de categorias ou níveis, Lj (j = 1, 2, … J). A quantidade de categorias pode diferir entre as variáveis, esperando-se variáveis com, no mínimo, duas categorias, ou outras com três, quatro, ou mais níveis.

Cada indivíduo é referenciado pela letra i ∈ { 1, 2, ..., I}; cada questão pela letra j ∈ { 1, 2, ..., J}; cada nível ou categoria, pela letra l ∈ { 1, 2, ..., Lj} | j, sendo Lj a quantidade de níveis. Os conjuntos das partições difusas (Perfis) serão indexados ´por k ∈ { 1, 2, ..., K}.

O ponto de partida para a modelagem GoM é a matriz de dados qualitativos XIxJ, na forma

X =

[

𝑋11 𝑋12 𝑋1𝐽 𝑋21 𝑋2𝐽

𝑋𝑖1 𝑋𝑖2 𝑋𝑖𝐽

𝑋𝐼𝐽 𝑋𝐼2 𝑋𝐼𝐽]

e o ponto de chegada, a matriz dos graus de pertencimentos individuais G, do tipo I x K,

G = [

𝑔11 𝑔12 𝑔1𝐾 𝑔21 𝑔2𝐾

𝑔𝑖1 𝑔𝑖2 𝑔𝑖𝐾

𝑔𝐼𝐽 𝑔𝐼2 𝑔𝐼𝐾]

O problema central é inferir algo sobre G através das observações X. Para tanto, uma suposição inicial nevrálgica é que a população de interesse X pode ser desmembrada por K subpopulações, por meio de representantes teóricos oriundos de X (os Tipos puros). Com base nisso, o conjunto de atributos desses Tipos, expresso são referenciados como Perfil Extremo ou Puro. Com isso, matematicamente, os Perfis Extremos são encarados como bases vetoriais, para as quais os elementos de X são expressos como combinações lineares, acarretando nos Tipos Mistos, como será verificado mais à frente.

Assim, sem perda de generalidade, um Perfil Extremo significa um conjunto de características relacionadas com determinada subpopulação de X. Desse modo, as K partições difusas serão denotadas pelos respectivos Perfis Extremos. Por suposição do método, existe, no mínimo, dois Perfis Extremos bem definidos na população de interesse. Esses Perfis correspondem aos conjuntos clássicos e respeitam todas as propriedades matemáticas desses conjuntos.

A questão que segue, num primeiro momento, é saber qual padrão comportamental governa os Perfis Extremos. Tal padrão não é evidenciado explicitamente em X; esconde-se nas associações não-observadas entre as categorias das J variáveis. Isso justifica, de certo modo, considerar que o “[...] método GoM foi proposto com a finalidade de identificar padrões latentes a partir de um conjunto de dados categóricos (PINTO E CAETANO, 2013, p. 168).

Certamente, esses padrões decorrem de um subconjunto de atributos que ocorrem em simultâneo para determinados elementos; são os níveis distintivos das respostas dos Perfis Extremos, a cada uma das J variáveis. Assim, para cada uma delas, pode-se agrupar seus níveis distintivos em conjuntos 𝐷𝑗, 𝑗 ∈ 𝐽 {1,2, . . . , 𝐽}. Dito isso, os diferentes 𝐷𝐽 formam conjuntos de todos os níveis distintivos das questões 𝑗 ∈ 𝐽 que ocorrem nos Perfis Extremos.

A título de exemplo, suponha-se o caso de um estudo com oito variáveis, cada uma com cinco níveis de respostas (representados numericamente pela sequência de números naturais) e que foi constatada a existência de três partições difusas. Os Perfis Extremos referentes a essas partições foram os seguintes23:

𝐾⃗⃗ 1 = (1, 4, 5, 2, 1, 2, 2,?); 𝐾⃗⃗ 2 = (3, 3, 3, 3, 3, 3, 3, ?); e 𝐾⃗⃗ 3 = (2, 1, 5, 5, 5, 4, 2, ?).

A partir desses vetores, obteve-se os seguintes subconjuntos: 𝐷1= {1,2,3}; 𝐷2= {1,3,4}; 𝐷3= {3,5}; 𝐷4 = {2,3,5}; 𝐷5= {1,3,5}; 𝐷6= {2,3,4}; 𝐷7= {1,2}; 𝐷8= ∅; sendo 𝐽 = {1,2,3,4,5,6,7}. Naturalmente, em X existem outros perfis, cujos atributos são elementos dos conjuntos 𝐷𝑗, como, por exemplo, o Perfil:

𝑥 9= (1,3,5,2,1,2,1,5).

23 As coordenadas marcadas pelo sinal de interrogação não contribuíram para a formação do Perfil Extremo, podendo assumir qualquer valor. Esse detalhe será tratado mais adiante, nos aspectos operacionais de implementação do GoM

Todavia, a atribuição dos níveis distintos só é válida para os vetores Tipos Puros. Em paralelo, vale ressaltar que o elemento 𝑥 9 difere de 𝐾⃗⃗ 1 apenas no caso da segunda variável. Por isso, na decomposição de X em subpopulações, está implícito que cada elemento de análise pode partilhar, parcialmente, as características comportamentais que definem o conjunto K (𝑘 = 1,2, . . . , 𝐾), em menor ou maior grau, a depender dos valores de 𝑔𝑖𝑘. Portanto, é esperado que a elevada proximidade de 𝑥 9 à 𝐾⃗⃗ 1 reflita em um alto valor para o coeficiente 𝑔9,1 .

Por fim, como será visto mais à frente, as variáveis que não contribuem para a formação dos Perfis Extremos são eliminadas das análises. No caso em tela, isso aconteceria com a variável 𝐷8. Diz-se, então, que a relevância da questão 8 para a caracterização dos Perfis Extremos é nula.

Por terem natureza qualitativa, as J variáveis aplicadas ao modelo estão sujeitas a uma codificação binária. Por conta disso, cada realização 𝑋𝑖𝑗 origina um vetor de 𝐿𝐽 coordenadas, das quais 𝐿𝐽− 1 são nulas e a restante, unitária. Tem-se, então:

𝑌𝑖𝑗𝑙 = {1, 𝑠𝑒 𝑋𝑖𝑗= 𝑙, 𝑙 ∈ {1,2, … , 𝐿𝐽}

0, caso contrário .

Atentar para o fato de que

𝐿𝑙=1𝐽 𝑌𝑖𝑗𝑙 = 1.

No modelo, os dados binários poderão ser manipulados de diversas formas.

Assim, 𝑌𝑖𝑗 representa o vetor – resposta do indivíduo i à questão j, e tem 𝐿𝑗 coordenadas. Quando a resposta for igual a l, esse vetor terá todas as coordenadas nulas, à exceção da l-ésima, que valerá 1. Por sua vez, o vetor 𝑌𝑖 corresponde ao conjunto de todas as respostas do indivíduo i, tendo como coordenada os subvetores 𝑌𝑖𝑗. Desse modo, 𝑌𝑖 é o Perfil do indivíduo i sob a forma binária.

A hipótese básica sobre Yijl é que essas variáveis binárias são aleatórias e independentes para diferentes valores de i, ou seja, o Perfil 𝑌𝑖 é independente do perfil 𝑌𝑖′ (com 𝑖 ≠ 𝑖′). Significa dizer que quaisquer dois estudantes participantes do Enade serão considerados estatisticamente independentes. Essa hipótese está consignada na aleatoriedade da amostra, aliada ao pressuposto de que X reflete a diversidade existente para todo o universo.

Como referido anteriormente, a caracterização dos Perfis Extremos é feita com base nas respostas dos elementos às variáveis do estudo e essas respostas foram designadas como níveis distintivos. No GoM, o reconhecimento desses níveis é feito em termos probabilísticos, a partir da estimativa de determinados parâmetros. A partir desse fato, elenca-se a seguinte hipótese do modelo:

A probabilidade da resposta l, para a j-ésima variável, pelo elemento pertencente ao k-ésimo Perfil Extremo é denotada por 𝜆𝑘𝑗𝑙(𝑘 = 1,2, … 𝐾; 𝑗 = 1,2, … 𝐽; 𝑙 = 1,2, … , 𝐿𝑗). Tem-se, então, que a distribuição das respostas dos elementos puros {𝜆𝑘𝑗𝑙} representam a base empírica para definição dos Perfis Extremos. Representam uma medida probabilística do comportamento dos elementos rígidos, dos conjuntos que formam a partição. Constrói-se, então, a formalização teórica entre a estrutura difusa e os elementos puros dos conjuntos, ou seja:

𝜆𝑘𝑗𝑙 = 𝑃[𝑌𝑖𝑗𝑙 = 1 ∨ 𝑔𝑖𝑘 = 1].

Tratando-se de probabilidades, os parâmetros 𝜆𝑘𝑗𝑙 obedecem às seguintes restrições:

i) 𝜆𝑘𝑗𝑙 ≥ 0; e ii) ∑𝐿𝑗 𝜆𝑘𝑗𝑙

𝑙=1 = 1.

Sob essas hipóteses, o vetor de caracterização dos Perfis Extremos é obtido a partir das estimativas de lambda, na forma:

𝐾⃗⃗ 𝑘 = (𝜆𝑘11, 𝜆𝑘12, … , 𝜆𝑘1𝐿1, … , 𝜆𝑘𝐽1, 𝜆𝑘𝐽2, … , 𝜆𝑘𝐽𝐿𝐽),(𝑘 = 1,2, … , 𝐾).

Apresentada a formalização dos Perfis Extremos, o próximo passo é discorrer sobre os aspectos teóricos relativos à associação dos demais elementos de X aos K conjuntos extremos. Como já dito, os coeficientes 𝑔𝑖𝑘 representam, genericamente, o grau de pertencimento dos elementos às partições de determinado universo de dados.

No GoM, esses coeficientes podem ser encarados como o nível de sobreposição de cada Perfil 𝑋 𝑖 sobre 𝐾⃗⃗ 𝑘. Segundo Guedes et al. (2016), o valor gik

remete à proporção ou intensidade de pertinência dos elementos a cada Perfil Extremo.

Por conta da natureza difusa do modelo, o valor numérico 𝑔𝑖𝑘 pode variar no intervalo 0 ≤ 𝑔𝑖𝑘 ≤ 1, em que o zero indica total pertinência e o um, total pertinência, sob as seguintes restrições:

i) 𝑔𝑖𝑘 ≥ 0, para cada i e j ; ii) 𝐾𝑘=1𝑔𝑖𝑘= 1, ∀ i .

Uma importante Hipótese relacionada com esses coeficientes é que a independência local das respostas de cada indivíduo às J variáveis está condicionada aos valores 𝑔𝑖𝑘 . Assim, as variáveis aleatórias Yijl são independentes para diferentes valores de J, sob a condição de serem conhecidos os valores do vetor 𝑔 𝑖 = (𝑔𝑖1, 𝑔𝑖2, 𝑔𝑖3… , 𝑔𝑖𝑘).

Isso significa que as possíveis associações não observadas entre 𝑋 𝑖𝑗 e 𝑋 𝑖𝑗, (𝑗 ≠ 𝑗) são governadas pelo vetor 𝑔 𝑖 = (𝑔𝑖1, 𝑔𝑖2, 𝑔𝑖3… , 𝑔𝑖𝑘). Então, estatisticamente, o referido vetor de pertencimento é suficiente para explicar as correlações não observadas entre as J variáveis. Por essa via, 𝑔𝑖𝑘 é uma variável latente, ao nível individual de cada elemento de X.

A independência local permite fatorar a probabilidade condicional conjunta de 𝑋 𝑖, na forma:

𝑃[𝑋 𝑖 = 𝑥 𝑖∨ 𝑔 𝑖] = ∏𝐽𝑗=1𝑃[𝑋 𝑖𝐽 = 𝑙 ∨ 𝑔 𝑖], 𝑙 ∈ {1,2, … , 𝐿𝑗}.

Combinando as hipóteses apresentadas com o fato da proposição 𝑋𝑖𝑗 = 𝑙ser equivalente a 𝑌𝑖𝑗𝑙 = 1, o modelo GoM é formalmente estabelecido a partir de

𝑃[𝑌𝑖𝑗𝑙= 𝑦 𝑖∨ 𝑔 𝑖] ≡ 𝑝𝑖𝑗𝑙 ≜ ∑ 𝑔𝑖𝑘𝜆𝑘𝑗𝑙

𝐾

𝑘=1

∴ 𝐸[𝑌𝑖𝑗𝑙∨ 𝑔 𝑖] = ∑ 𝑔𝑖𝑘𝜆𝑘𝑗𝑙

𝐾

𝑘=1

A expressão de formalização do GoM representa a ponte entre a definição de partição difusa e uma expressão paramétrica para a probabilidade de uma resposta discreta específica. Nesse contexto, 𝑝𝑖𝑗𝑙representa uma medida multidimensional estabelecida entre cada elemento de X e suas respectivas subpopulações, ao menor nível de especialização possível, ou seja, ao nível da resposta individual de cada elemento às l categorias de cada variável.

Ademais, se, de fato, a heterogeneidade estiver bem confinada aos K subconjuntos de X, as probabilidades 𝑝𝑖𝑗𝑙 podem ser assumidas constantes em cada uma dessas Classes, reduzindo, nesse caso, o contradomínio de 𝑔𝑖𝑘 ao conjunto {0, 1}, remetendo o GoM á uma estrutura de segmentos latentes (MANTON et al., 1994).

Estruturada a formalização teórica do GoM, pode-se, finalmente, estabelecer um modelo probabilístico adequado que permita a obtenção dos estimadores dos parâmetros 𝑔𝑖𝑘𝑒𝜆𝑘𝑗𝑙. Assim, como o número de níveis de cada questão, Lj , é, por

definição, finito e porque as variáveis aleatórias 𝑌𝑖𝑗𝑙(𝑙 = 1,2, . . . , 𝐿𝑗) configuram ocorrências exaustivas e mutuamente excludentes, pode-se considerar que a distribuição de probabilidades de 𝑌𝑖𝑗 = (𝑌𝑖𝑗1, 𝑌𝑖𝑗2, . . . , 𝑌𝑖𝑗𝐿𝑗) segue um modelo de distribuição Multinomial, que é uma generalização do modelo de distribuição Binomial.

A partir disso, segue-se que:

𝑌𝑖𝑗 𝑀𝑢𝑙𝑡(1; 𝑝 𝑖𝑗), 𝑐𝑜𝑚𝑝 𝑖𝑗 = (𝑝𝑖𝑗1, 𝑝𝑖𝑗2, . . . , 𝑝𝑖𝑗𝐿𝐽).

Isso posto, para uma amostra aleatória de dimensão I x J, e assumindo válidas todas as hipóteses teóricas apresentadas para o GoM, a função de verossimilhança do modelo probabilístico de 𝑌𝑖𝑗 é expressa a partir de

A partir de L(Y) obtém-se os estimadores de máxima verossimilhança dos parâmetros, os quais possuirão todas as propriedades estatísticas dessa classe de estimadores. Para tanto, deve-se maximizar a função L(Y) com relação a cada conjunto de estimadores. Matematicamente, isso é feito igualando-se as derivadas parciais da log-verossimilhança a zero, com o uso de multiplicadores de Lagrange, pois há restrições sobre o conjunto de valores permitidos para 𝑔𝑖𝑘 𝑒 𝜆𝑘𝑗𝑙 , conforme debatido.

Nesse caso, é necessário recorrer a cálculos numéricos de forma iterativa, pois as expressões dos estimadores não possuem “forma fechada”, ou seja, as estimativas não são obtidas a partir de um resultado delimitado, conhecido; mas sim a partir de sucessivas aproximações numéricas.

As propriedades matemáticas e estatísticas desses estimadores, bem como a forma de obtenção de suas respectivas expressões analíticas não serão detalhadas aqui. Essas informações podem ser encontradas em Manton et al.. (1994) ou em Cerqueira (2004).