MÉTODOS ALTERNATIVOS NO CRITÉRIO BRASIL PARA CONSTRUÇÃO DE INDICADORES SÓCIO-ECONÔMICOS: TEORIA DA RESPOSTA AO ITEM.

(1)

MÉTODOS ALTERNATIVOS NO CRITÉRIO BRASIL PARA CONSTRUÇÃO DE

INDICADORES SÓCIO-ECONÔMICOS: TEORIA DA RESPOSTA AO ITEM.

Tufi Machado Soares

Departamento de Estatística

Universidade Federal de Juiz de Fora – UFJF tufi@estatistica.ufjf.br

Reinaldo Castro Souza

Departamento de Engenharia Elétrica

Pontifícia Universidade Católica do Rio de Janeiro – PUC-Rio reinaldo@ele.puc-rio.br

Vinicius Ribeiro Pereira

Departamento de Engenharia Elétrica

Pontifícia Universidade Católica do Rio de Janeiro – PUC-Rio vinicius@ele.puc-rio.br

ABSTRACT

The IRT (Item Response Theory) hás been used in Brazil mainly in the production os proficiency indices related to large scale educational e assessment. However, the distinc models include in the formulation allow broader aplications in the construction of índices, as; for instance, social-economical index (SEI). These are only a few publiched studies on techiniques to formulates SEI specially those using the IRT. In this paper it is prposed a new formulation for the SEI in Brazil based on the IRT the obtained index is compared with the official one, knowns as “Critério Brasil”.

Key-Words: Item Response Theory, Multidimensional Model, Socio-Enconomic Status

Introdução

Atualmente, em várias áreas do conhecimento, particularmente em avaliação educacional, vem crescendo o interesse na aplicação de técnicas derivadas da Teoria da Resposta ao Item – TRI, que propõem modelos para os traços latentes, ou seja, características do indivíduo que não podem ser observadas diretamente. Estimativas para esse tipo de variável devem ser obtidas a partir da observação de variáveis secundárias que estejam diretamente relacionadas a ela. Chamada de variáveis indicadoras.

Uma das grandes vantagens da TRI sobre a teoria clássica é que ela permite a comparação entre indivíduos de uma mesma população, ou mesmo de populações diferentes, que podem ter sido submetidos a instrumentos (questionários) parcialmente diferentes. Isto porque uma das principais características da TRI é que ela tem como elementos centrais modelos para os itens e não a prova como um todo.

O Critério Brasil é um critério de classificação sócio econômica que tem como objetivo estimar o potencial de compra das famílias e segmentar o mercado em classes econômicas (estratos sociais). Uma vez criado tal critério, os bens de consumo produzidos podem ser, melhor, direcionados para a população de interesse, em uma escala de produção versus venda mais eficiente. Contudo, esse critério não se pretende dividir a sociedade em classes sociais. Por isso tem-se o cuidado de classificar as famílias em

(2)

estratos sociais e não em classes sociais. Pois, entende-se pelo último um conceito que necessita de uma abordagem mais sociológica.

Acredita-se que tal critério tem uma forma “rígida” de classificar o nível sócio econômico (NSE) de uma dada população, não levando em conta possíveis informações contidas nos processos seletivos que não aparecem no modelo atual de criação do critério. A TRI permite construir indicadores capazes, por exemplo, de discriminar melhor os indivíduos, pois consegue retirar mais informação dos dados, possibilitando, ainda, um melhor conhecimento sobre cada item que compõe o critério. O que conduz ainda a uma melhor interpretação do índice produzido.

O estudo de caso desse estudo se situa no contexto do projeto: Pesquisa e Posse de Eletrodomésticos e Hábitos de Consumo do programa PROCEL (programa de combate ao desperdício de energia elétrica). Esta pesquisa, por sua vez , tem o objetivo de prover de informações os órgãos interessados no consumo de energia elétrica na zona urbana, especificamente no caso do estado do Mato Groso do Sul. O processo de coleta de dados se dá por meio da aplicação pessoal de questionários na população dos consumidores de energia. A amostragem desses consumidores obedece a um esquema de amostragem em múltiplos estágios, pois as cidades são sorteadas e dentro delas consumidores são sorteados aleatoriamente tendo os mesmos sido anteriormente estratificados por faixas de consumo. As cidades também são estratificadas segundo o perfil de seus consumidores e obedecem ao esquema de amostragem proporcional ao tamanho. Assim o projeto pode nortear os órgãos competentes sobre qual é a melhor política de investimento no setor elétrico para a população em questão.

Tendo em vista que tal pesquisa tem sido orientada em boa parte dos estados do Brasil, sua abrangência requer metodologias que sejam capazes de comparar os resultados dos diferentes levantamentos. Um dos interesses do estudo é traçar o perfil sócio econômico da população e, geralmente, este é baseado na construção do índice do Critério Brasil.

O objetivo geral desse estudo é proporcionar reflexão sobre a adoção desse critério na forma como vem sendo utilizado, principalmente porque, perece-nos natural admitir que para cada tipo de estudo um critério mais especifico deveria ser empregado.

A teoria da resposta ao item permite a produção de índices desse tipo baseada em modelos muito mais estruturados do que aqueles empregados no Critério Brasil. Assim, um objetivo específico desse estudo é o de verificar a adequação do uso da TRI nesse exemplo em particular, comparando o indicador produzido com o Critério Brasil.

1. Traços Latentes e a Teoria de Resposta ao Item.

Em muitas medidas sociológicas, psicológicas ou educacionais a variável de interesse é de entendimento intuitivo para todos. Porém, na maioria das vezes, não é observável diretamente. É isto que a psicometria chama de variáveis não observáveis ou habilidades ou traços latentes. Embora essas variáveis possam ser facilmente descritas e listadas, como por exemplo, a inteligência, a habilidade em executar uma tarefa, ansiedade, o nível de entendimento de texto, e etc, elas não podem ser medidas diretamente como o peso ou altura de uma pessoa. Apesar de todas serem características implícitas a cada ser humano. A meta das medidas educacionais e psicológicas é determinar como os traços latentes se processam na pessoa.

Se for de interesse medir tal traço latente é necessário se utilizar de variáveis indicadoras as quais, sob critérios dos especialistas, se associam diretamente ao traço latente. A partir dos resultados obtidos para as variáveis indicadoras (ou itens) o traço latente pode ser criado através de modelos de uma teoria específica.

É razoável admitir a hipótese de que cada examinando responda a um item de acordo com habilidades implícitas. Por motivos que depois será explicado admitiremos que se deseje medir apenas uma habilidade que representaremos pela letra grega θ.

(3)

Por exemplo, no caso de itens dicotômicos, a cada valor do traço latente estará associada uma certa probabilidade de que o respondente escolherá a resposta i no item. Para o respondente j e o i-ésimo item esta probabilidade será denotada por P_i(

θ

_j).

Do ponto de vista prático questões de respostas livres são de difícil uso na TRI (exceto se a resposta for caracterizada como certo ou errada ou, ainda, como algum tipo de graduação). Como resultado, a maioria dos testes usados na TRI são de múltipla escolha e os itens podem ser dicotômicos (certo ou errado) ou politômicos (incorporam variáveis categóricas em suas respostas).

A curva que caracteriza essa P_i(

θ

_j)tem, em geral, uma forma de “S amortecida”. Isso não é arbitrário, mas advém de muitos estudos empíricos e pioneiros. Ela é conhecida como curva característica do item (CCI) e é a base da construção da TRI, todas as outras construções dependem dela. Existem duas propriedades técnicas da CCI que são usadas para descrevê-las: dificuldade do item e seu poder de discriminação.

2. Teoria de Resposta ao Item - TRI

A TRI constitui-se a partir de um conjunto de modelos matemáticos que buscam representar a relação entre a probabilidade de um indivíduo dar uma determinada resposta a um item como função dos parâmetros do item e da habilidade do respondente, caso paramétrico. No caso dicotômico esta relação é sempre expressa de tal forma que quanto maior a habilidade, maior a probabilidade de uma determinada escolha, que vamos chamá-la de acerto, ao item. O termo acerto é utilizado apenas devido a origem da TRI estar associada a testes educacionais. No presente contexto, em que a variável latente que é objeto do estudo representa uma condição sócio-econômica familiar, a resposta dicotômica pode representar por exemplo o fato de se possuir ou não determinado bem.

Existia a necessidade de encontrar uma função não linear que expressasse a relação entre a probabilidade do respondente a dar uma certa resposta em função de sua habilidade. A própria necessidade desta função já impunha a restrição da CCI ser monótona crescente. A função devia também ser dependente da característica do item.

Birnbaum foi motivado pelo trabalho de LORD (1952). Uma contribuição importante de Birnbaum foi sugerir a troca da função ogiva normal pelo modelo logístico de dois parâmetros por questões de conveniência. Além disso foi Birnbaum, também, quem introduziu o terceiro parâmetro (vulgarmente conhecido como parâmetro de acerto casual, que modela um acerto em um teste educacional devido a um chute na questão). Uma outra contribuição de Birnbaum para a teoria psicométrica foi a introdução da medida de Fisher para descrever a estrutura de informação do teste. O conteúdo de informação de um teste para uma habilidade do respondente desconhecida é a soma de todas as informações individuais de cada item.

Paralelamente ao trabalho de Birnbaum, RASH que nos anos 40 já trabalhava em medidas psicométricas (Linden e Hambleton (1997)), pelos anos 50 começou a desenvolver seu trabalho para modelos dicotômicos que por razões históricas ficaram conhecidos como modelo de RASH. Vale lembrar que formalmente os modelos de RASH são um caso particular de Birnbaum, mas que conduzem a uma teoria da análise do teste completamente diferente.

A própria necessidade dos testes psicométricos de introduzir respostas que não fossem consideradas somente dicotômicas encarregou-se de motivar a ciência a desenvolver modelos para TRI que tratassem de tais necessidades como: Modelo de Resposta graduada, Modelo de Crédito Parcial, Modelo de Escala Gradual, entre outros. Para maior detalhe destes modelos recomenda-se (Linden e Hambleton (1997)).

(4)

2.2 Hipóteses básicas.

Os modelos matemáticos empregados na TRI especificam que a probabilidade de resposta certa de um respondente depende de sua habilidade ou habilidades e as características do item. Modelos da TRI aqui tratados incluem um conjunto de hipóteses sobre os dados em que o modelo é aplicado.

A primeira hipótese é chamada de unidimensionalidade. Esta hipótese admite que somente uma habilidade é medida pelo modelo. Isto é, o conjunto de itens deve estar medindo um único traço latente. Parece claro que dentro das instâncias do ser humano exista uma variedade de habilidades responsáveis por um processo de execução de uma tarefa. Porém, para satisfazer tal postulado, é suficiente admitir que haja uma habilidade dominante, responsável pelo conjunto de itens. Este fator é que se supõe estar sendo medido pelo teste (Hambleton, 1991). Tipicamente a análise de unidimensionalidade é obtida através de métodos de análise fatorial. De certa forma, o que se está de fato admitindo-se é que o modelo será suficientemente robusto à multidimensionalidade existente. Modelos que incorporam mais de uma habilidade para performance de um teste são chamados de multidimensionais.

Uma outra suposição é a chamada independência local ou invariância, a qual postula que, para uma dada habilidade, as respostas atribuídas aos diferentes itens são independentes entre si. Tal pressuposto será importante para a estimação dos parâmetros nos modelos.

Teoricamente, a unidimensionalidade implica na independência local (Hambleton, 1991) e assim apenas uma e não duas hipóteses devem ser verificadas. De fato, se houver dependência local entre os itens essa produzirá falsas dimensões na análise fatorial.

2.2 Modelos.

Teoricamente pode existir uma infinidade de modelos da TRI. Porém, poucos modelos são usados na prática. Entre os modelos propostos na literatura dependem fundamentalmente de três fatores:

(i

)

da natureza do item – dicotômicos ou politômicos;

(ii

)

do número de populações envolvidas;

(iii

)

da quantidade de traços latentes que está sendo medida.

2.2.1 Modelos para itens com formato de resposta politômica.

Itens politômicos são itens que não se caracterizam apenas pela presença do fator certo ou errado, mas toda um conjunto ordenado de respostas. Em particular, o modelo de resposta graduada foi desenvolvido por Samejima (1965). Recomenda-se a leitura do livro (Linden, 1991) para aqueles que desejam se aprofundar no conhecimento dos inúmeros modelos existentes hoje.

Modelo de respostas graduadas (MRG).

O MRG de Samejima (1962) assume que as categorias de respostas de um item podem ser ordenadas entre si.

Suponha que os scores das categorias de um item i estão dispostos em ordem crescente denotamos por

k

=

_{0 K},1, ,

m

_i onde (

m

_i

+

1) é o número de categorias do i-ésimo item. A probabilidade de um indivíduo j escolher uma particular categoria ou outra mais alta do item i é representada por:

) ( * , _,

1

1 )

(

k i j i b Da j k i

e

P

₋ ₋

+

=

_θ

θ

um modelo logístico de dois parâmetros, com

i

=

_{1 K}

,

I

;

j

=

_{1 K}

,

n

;

b

_i_,_ké o parâmetro de dificuldade da k-ésima categoria do item i.

(5)

Por definição do modelo temos:

b

_i,1

≤

b

_i,2

≤

K

≤

b

_i,_m_i ordenação entre os níveis de dificuldade das categorias de um dado item.

A probabilidade de um indivíduo j receber um score k no item i é dada pela expressão:

P

_i_,_k

(

θ

_j

)

=

P

_i*_,_k

(

θ

_j

)

−

P

_i*_,_k₊₁

(

θ

_j

)

E Samejima também admite que *

(

)

1

0 , j

=

i

P

θ

e, * ( ) 0 1 ,m+ j = i i P θ . Tem-se então: ) ( 1 ) ( ) ( * 1 , * 1 , * 0 , 0 , i j i j i j i P P P P =

θ

−

θ

= −

θ

)

(

)

(

* 2 , * 1 , 1 , i j i j i

P

=

θ

−

θ

) ( ) ( ) ( * , * 1 , * , ,m im j im j im j i P P P P = θ − + θ = θ , em geral tem-se:

(

)

*

(

)

0

1 , * , ,k

=

ik j

−

ik+ j

≥

i

P

θ

.

Na forma logística o modelo de respostas graduadas é dado por:

) ( ) ( , 1 , , ₁ 1 1 1 ) ( + − − − − + − + = k i j i k i j i b Da b Da j k i e e P θ _θ _θ

3. Estimação dos parâmetros.

O primeiro e mais importante passo na aplicação da TRI a dados de testes é a estimação dos parâmetros que caracterizam o modelo de resposta ao item.

Nos modelos da TRI, a probabilidade de uma resposta depende, da habilidade do examinando,

j

θ

, e os parâmetros que caracterizam o item. Ambos habilidade e parâmetros do item, na maioria das vezes, são desconhecidos; o que é conhecido são as respostas dos examinados aos itens do teste. O problema da estimação é determinar o valor de

θ

_j para cada examinado e os parâmetros que compõe cada item do teste.

Os parâmetros podem ser estimados usando o método da máxima verossimilhança através da aplicação de algum processo iterativo, como o algoritmo de Newton-Raphson ou “Scoring” de Fisher. Alguns procedimentos Bayesianos também são aplicados com alguma freqüência (ver Mislev (1986ª)).

Na situação em que se deseja estimar tanto os parâmetros dos itens, quanto as habilidades, há duas formas de se abordar o problema de estimação: estimação conjunta ou em duas partes (máxima verossimilhança marginal) primeiro a estimação dos itens e, posteriormente, das habilidades. No presente trabalho usamos a estimação em duas partes.

Recomenda-se para aprofundamento de estimação de parâmetros dos modelos de resposta ao item: Hambleton [3] ou Linden [4], Andrade et al, 2001.

4. Métodos Clássicos para Discriminação dos Itens e Análise da Dimensionalidade. 4.1 Correlação Polisserial e Ponto Polisserial.

Os conceitos de correlação ponto bisserial e bisserial podem ser estendidos para o caso de itens politômicos, os quais apresentam mais de duas categorias de respostas (T ,T ,...,T ),T₀ ₁ _m _{K 1}₊ ≥T ._K A correlação ponto polisserial (

ρ

_ppol )é definida, simplesmente, como sendo a correlação de Pearson entre o escore bruto do teste e o escore do item, medido segundo uma escala ordena de inteiros cujas diferenças

(6)

entre dois valores sucessivos seja sempre a mesma ( por exemplo, (0, 1, 2, ..., m) ). A relação entre a correlação polisserial e a correlação ponto polisserial é definida como:

k 1 pol ppol m 1 p k 1 k k 0 Z (T T ) σ ρ ρ + − + = = −

∑

onde pk 1+ é a proporção dos que alcançaram o k-ésimo escore e σ é o desvio padrão dos escores alcançados no item.

5. Critério de Classificação Sócio Econômica.

De acordo com Matar (1996), a motivação para criar uma metodologia com critérios padronizados de classificação dos consumidores em distintas classes sociais surgiu das práticas de marketing adotadas pelas agências de propaganda. Era preciso segmentar o mercado a fim de que cada empresa soubesse onde estava o seu público alvo. Ainda fazia-se necessário obter uma linguagem comum entre as diversas pesquisas de mercado. No Brasil não havia, até 1970, um critério único, objetivo e geral, de classificação sócio-econômica dos consumidores. Na medida que algumas empresas passaram a adotar práticas de marketing, principalmente a segmentação de mercado, surgiu a necessidade de se dispor de um critério de estratificação que facilitasse essas práticas. Na ausência de critério único, cada empresa, cada agência de pesquisa, acabava estabelecendo o seu próprio. Segundo Matar (1996), o que se por um lado atendia de imediato às suas necessidades, por outro criava grande problema, pois impedia o intercâmbio e até a comunicação entre empresas, agências de pesquisa, agências de propaganda e veículos de comunicação, já que não se falava a mesma língua.

5.1

Critério de Classificação Econômica Brasil (2003) – CCEB.

O Critério de Classificação Econômica Brasil, adotado por empresas anunciantes, agências de publicidade, institutos de pesquisa e por todos profissionais de marketing e pesquisa de mercado que necessitam estabelecer critérios de segmentação em função do poder aquisitivo dos consumidores, foi desenvolvido visando atender a dois objetivos fundamentais: montar um sistema de pontuação da população que fosse um eficiente estimador da sua capacidade de consumo; e estabelecer "cortes" na distribuição dessa população que permitissem discriminar os grandes grupos de consumidores.

Itens Não tem Tem 1 Tem 2 Tem 3 Tem 4 ou + tv 0 2 3 4 5 radio 0 1 2 3 4 banheiro 0 2 3 4 4 carro 0 2 4 5 5 empregada 0 2 4 4 4 aspirador 0 1 1 1 1 Maq. lavar 0 1 1 1 1 Vídeo/DVD 0 2 2 2 2 geladeira 0 2 2 2 2 freezer 0 1 1 1 1

Tabela 1. Pontuação do Critério Brasil. ANEP – Associação Nacional de Empresas de Pesquisa - www.anep.org.br .

Analfabeto / primário incompleto 0 Primário completo / ginasial incompleto 1 Ginasial completo / colegial incompleto 2 Colegial completo / superior incompleto 3

Superior completo 5 Classe Pontos A1 30---34 A2 26---29 B1 21---24 B2 17---20 C 11---16 D 6---10 E 0---5

(7)

6. A execução do trabalho.

Já sabendo previamente que o modelo de respostas graduadas da TRI era o mais adequado para implementação, o próximo passo é o de analisar a natureza de cada opção de item, bem como a transformação das que se faziam necessárias. Como já foi descrito anteriormente o MRG necessita para sua implementação que haja uma ordem graduada crescente entre as opções. Os itens que apresentavam formato dicotômico não precisaram ser modificados, pois o modelo logístico de dois parâmetros é um caso particular do MRG. Uma vez realizada a transformação das opções o passo seguinte foi implementar uma análise de fatores para os itens intervalares. A análise fatorial neste momento é importante para possibilitar a verificação das possíveis correlações espúrias.

A primeira análise fatorial teve como objetivo identificar um conjunto menor de variáveis.

A Apresentação do resultado da primeira analise fatorial foi realizada com auxílio do software SPSS®_{. Utilizou-se o método de extração por componentes principais, seguida da aplicação do método de} rotação VARIMAX. O resultado obtido para a matriz de cargas nos fatores associadas às variáveis nos levou a perceber que existem algumas variáveis a priori que estavam no questionário com exatamente o mesmo objetivo de pergunta. È o caso das variáveis: Máquina de Lavar e Lava Roupa; Rádio e Rádio

Elétrico. Uma vez percebido tal fato o procedimento foi apenas de escolher uma delas.

O próximo passo foi estimar quais itens eram irrelevantes para a análise construtiva do índice, pois não se associavam adequadamente ao restante dos itens. Tal procedimento foi realizado pelo software Parscale®_{, utilizando-se as correlações polisseriais.}

7. Índices Para o Padrão de Vida.

O questionário possui em torno de 60 questões das mais variadas possíveis com intuito de traçar um perfil de consumo de energia e posse de aparelhos que consumam energia. Parte dessas questões é destinada à avaliação da condição sócio-econômica familiar do respondente. Ver Tabela 2 abaixo.

Note-se que a questão Q04 refere-se à escolaridade do chefe de família. De fato, a variável resultante dessas questões pode ser uma boa proxy para a condição sócio-econômica da família e portanto será utilizada na produção dos índices.

A primeira questão a ser observada é a da escolha dos níveis de medida das variáveis. Modelos diferentes são empregados quando se têm níveis diferentes de medida. Freqüentemente, há necessidade de se aproximar uma variável com um determinado nível de mensuração para um outro nível, este é o caso freqüente da aproximação de variáveis com escalas ordinais para escalas intervalares. Essa aproximação ocorre, sobretudo, quando as ferramentas que estão disponíveis para a condução das análises não são totalmente adequadas ao nível de medida que foi empregado na construção original das variáveis, o que pode ser devido à experiência do analista ou devido à disponibilidade de softwares para análise ou, ainda, pela inexistência de métodos adequados.

No presente estudo, como pode ser observado pela forma como as questões foram construídas, há variáveis com nível de medida categórico que essencialmente admitem respostas dicotômicas (Se o domicílio aquece ou não a água, usando chuveiro elétrico? (0-não; 1-sim) etc), outras com nível intervalar, porém com valores inteiros (número de geladeiras, televisores, e etc), o que se caracteriza por variáveis típicas de contagem, e outras com nível ordinal de medida (as que medem a escolaridade do chefe de família).

Algumas perguntas originais foram transformadas (divididas) em outras para a busca de uma melhor análise. As questões transformadas foram com base em uma análise de distribuição de freqüência das respostas dadas pelos respondentes. Segue abaixo a tabela com as perguntas que foram utilizadas para análise.

(8)

Tabela 2. Questões utilizadas na construção do índice.

Questão Descrição Questã o

Descrição

Q01 Numero de banheiros na casa? (0; 1; 2; 3; 4 ou mais) Q22 Numero de videocassetes? (0; 1; 2 ou mais) Q02 Numero de carros? (0; 1;2; 3; 4 ou mais) Q23 Numero de computadores? (0; 1; 2 ou mais) Q03 Numero de empregados? (0; 1; 2 ou mais) Q24 Numero de videogames? (0; 1)

Q04 Nível de instrução do chefe da família?(1) até primário incompleto; (2) até ginasial incompleto; (3) até colegial incompleto; (4) até superior incompleto; (5) curso superior completo

Q25 Numero de ferro de passar? (0; 1; 2 ou mais)

Q05 Tipo de domicilio: (1-casa; 2-apartamento; 3-outro) Q26 Numero de maquinas de lavar roupa? (0; 1; 2 ou mais) Q06 Tipo de parede: (1-alvenaria; 2-madeira;3-material

aproveitado)

Q27 Numero de maquinas de lavar louça? (0; 1; 2 ou mais)

Q07 Seu piso é de terra? (1-sim; 0-não) Q28 Numero de secadora de roupa? (0; 1) Q08 Seu piso é de cimento? (1-sim; 0-não) Q29 Numero de forno de microondas? (0; 1) Q09 Sua cobertura é de laje de concreto? (1-sim; 0-não) Q30 Numero de forno de forno elétrico? (0; 1) Q10 Sua cobertura é de telha de barro? (1-sim; 0-não) Q31 Numero de liquidificadores? (0; 1) Q11 Sua cobertura é de telha de amianto? (1-sim; 0-não) Q32 Numero de batedeiras? (0; 1) Q12 Sua cobertura é de zinco? (1-sim; 0-não) Q33 Numero de cafeteira elétrica? (0; 1) Q13 Área constrída da residência m2_{: (1) ate 50; (2) de 51 a}

75; (3)de 76 a 100; (4)de 101 a 150; (5)de 151 a 200; (6)acima de 200

Q34 Numero de panelas elétricas? (0; 1)

Q14 Condição de ocupação do domicílio: (1-próprio; 2- não próprio)

Q35 Numero de exaustores? (0; 1)

Q15 O domicilio possui abastecimento de água? (1-não é rede geral; 2- é rede geral)

Q36 Numero de ventiladores? (0; 1; 2; 3; 4 ou mais)

Q16 Numero de geladeiras? (0; 1; 2; 3 ou mais) Q37 Numero de aquecedores? (0; 1) Q17 Numero de freezer? (0; 1; 2 ou mais) Q38 Numero de enceradeiras? (0; 1) Q18 Numero de aparelhos de ar condicionado? (0; 1; 2; 3 ou

mais)

Q39 Numero de aspiradores de pó? (0; 1)

Q19 Numero de tv? (0; 1; 2; 3; 4 ou mais) Q40 Numero de bombas dágua? (0; 1)

Q20 Numero e aparelhos de som? (0; 1; 2 ou mais) Q41 Numero de chuveiros elétricos? (0; 1; 2; 3 ou mais)

Q21 Numero de radios? (0; 1; 2 ou mais) Q42 Se o domicílio aquece ou não a água, usando chuveiro elétrico? (0-não; 1-sim)

7.1

Índice obtido a partir de modelos para respostas graduadas.

Finalmente, com o intuito de buscar maior informação na construção do índice sócio-econômico, explorando-se ao máximo a estrutura das questões, utilizou-se modelos de respostas graduadas na construção do índice (ver seção 2.2.1).

Para calibração dos modelos foi utilizado o software Parscale. Inicialmente produziu-se as correlações de Pearson e Polisserial de cada variável.

O primeiro passo na análise é o da avaliação da correlação polisserial, para verificar se uma determinada variável apresenta correlação significativa com o escore bruto produzido com o conjunto das variáveis. Esse passo é crucial para a escolha de itens que de fato apresentam consistência interna e se associam bem ao escore que será produzido. Normalmente, aceita-se valores para a correlação polisserial superior a 0.3.

Os resultados permitiram concluir que as variáveis Q05 (0.214); Q12 (-0.031); Q14 (0.088); Q15 (-0.343); Q21 (0.082) e Q37 (0.271) não apresentam uma boa correlação com o escore bruto produzido pelo conjunto das variáveis, portanto, não apresenta boa discriminação para o índice que se deseja produzir. Essas variáveis, então, são excluídas de qualquer análise posterior.

Os parâmetros do modelo de resposta graduada, com seus respectivos erros-padrão, são apresentados abaixo.

(9)

Tabela 3. Parâmetros dos itens. Questão Parâmetro de Discriminação (a) Parâmetro de Dificuldade (b) Parâmetro de Dificuldade de Cada item Q01 1,511 (0,070) 0,592 (0,037) ∞ 3.81 -0.191 -1.183 -1.807 Q02 1,405 (0,075) 2.239 (0,041) ∞ 1.771 0.273 -0.784 -1.260 Q03 1,516 (0,120) 2,059 (0,065) ∞ 0.699 -0.699 Q04 0,718 (0,030) 0,987 (0,058) ∞ 1.501 0.515 -0.168 -1.847 Q06 0,626 (0,041) -2,746 (0,117) ∞ 0.996 -0.996 Q07 1,960 (0,309) -2,437 (0,119) * Q08 0,636 (0,051) -0,959 (0,085) * Q09 0,342 (0,052) 2,762 (0,405) * Q10 0,144 (0,039) 2,015 (0,599) * Q11 0,401 (0,043) -0,875 (0,124) * Q13 0,829 (0,025) 0,147 (0,042) ∞ 2.676 0.927 -1.009 -2.593 Q16 0,758 (0,028) 1,879 (0,063) ∞ 3.711 -0.720 -2.991 Q17 0,862 (0,053) 2,521 (0,068) ∞ 1.464 -1.464 Q18 1,349 (0,092) 2,103 (0,066) ∞ 0.568 -0.025 -0.543 Q19 0,953 (0,032) 1,150 (0,041) ∞ 3.010 0.267 -1.150 -2.127 Q20 0,643 (0,028) 1,574 (0,063) ∞ 2.254 -2.254 Q22 1,309 (0,071) 1,721 (0,041) ∞ 1.102 -1.102 Q23 1,682 (0,146) 2,399 (0,068) ∞ 0.700 -0.700 Q24 0,769 (0,080) 2,105 (0,163) * Q25 0,889 (0,044) 0,631 (0,085) ∞ 2.920 -2.920 Q26 0,778 (0,041) 1,584 (0,067) ∞ 2.771 -2.771 Q27 0,759 (0,114) 3,004 (0,332) * Q28 0,764 (0,151) 3,555 (0,526) * Q29 1,493 (0,120) 1,379 (0,059) * Q30 0,803 (0,100) 2,568 (0,229) * Q31 0,967 (0,069) -1,083 (0,065) * Q32 0,896 (0,060) 0,193 (0,049) * Q33 0,666 (0,080) 2,498 (0,235) * Q34 0,712 (0,152) 3,780 (0,623) * Q35 0,739 (0,095) 2,666 (0,255) * Q36 0,619 (0,020) 1,498 (0,055) ∞ 2.833 0.475 -0.868 -2.440 Q38 0,702 (0,087) 2,590 (0,245) * Q39 1,206 (0,126) 2,027 (0,118) * Q40 0,398 (0,080) 4,227 (0,765) * Q41 1,166 (0,044) 1,117 (0,035) ∞ 1.950 -0.449 -1.502 Q42 1,233 (0,092) 1,151 (0,060) *

Uma segunda análise fatorial foi realizada com o objetivo de verificar se a hipótese da unidimensionalidade está sendo satisfeita. Ao contrário da primeira análise fatorial cujo objetivo principal era o de analisar correlações espúrias e investigar outras variáveis latentes associadas às questões. A segunda análise fatorial trará a informação sobre a violação ou não do postulado do modelo unidimensional logístico MRG. Se o pressuposto estiver sendo violado, significa apenas que o modelo não está adequado, mas não implica que a TRI não possa ser usada. Haja vista que existem modelos apropriados para casos multidimensionais (Linden, 1997).

Com base na segunda análise fatorial podemos perceber que cerca de 65% da variância total é explicada pela componente 1. Isto nos leva a conceber que a hipótese de unidimensionalidade não foi violada. Segundo Hambleton (1991) a unidimensionalidade não pode ser inspecionada diretamente, porém existem evidências que podem ser coletadas e analisadas e foi isso que fizemos ao produzir uma segunda análise fatorial. Hambleton afirma ainda que se a unidimensionalidade é satisfeita, a investigação da dependência local não é necessária, pois esta é conseqüência direta da presença da primeira. Porém a

(10)

independência local pode ser obtida mesmo que a unidimensionalidade não seja satisfeita (Hambleton (1991) p 10-11).

8. Resultados e Interpretação do Índice Construído.

Apresentam-se, nesta seção, os resultados dos scores e interpretação da escala produzida. O objetivo é o de procurar responder questões do tipo: O que significa uma família apresentar um score de 1.38 para o seu nível sócio-econômico, por exemplo?

A construção da escala de leitura foi feita através de métodos empíricos e o uso de conhecimentos prévios, baseados em teorias sociológicas, para tal. Os gráficos de cada item de estudo gerados pelo modelo de resposta graduada foram de grande importância na construção e geração da leitura dos scores.

8.1 Escalas.

Para um melhor entendimento sobre o resultado, segue a apresentação das faixas dos scores produzidos pela TRI para a referida população em estudo.

Cor Significado

Não possui

Possui um item com chance menor que 50 %

Possui um item com chance maior que 50 % e menor que 70 %

Possui um item com chance maior que 70 % ou possui dois itens com chance menor que 30 % Possui mais de um item com chance maior que 50 % e menor que 70 %

Chance de possuir dois ou mais itens com chance maior que 70 %

-4 a -3 -3 a -2 -2 a -1 -1 a -0.5 -0.5 a 0.0 0.0 a 0.5 0.5 a 1 1 a 2 2 a 3 3 a 4 geladeira itens chuveiro básicos rádio t.v. aspirador de pó itens 2a maquina lavar necessidade videocassete freezer ar condicionado itens empregada conforto carro itens estrutura banheiro casa instrução chefe de A B C D família

A – possui primário incompleto; B - possui até colegial incompleto; C - possui superior incompleto; D - possui superior completo.

Quanto à divisão Estrutura da casa achamos pertinente deixar de fora do quadro e dar um tratamento especial na leitura da escala.

Leitura do score Caracterização

-4 ≤ score ≤ -3 Temos casas com área construída de até 50 m2_{. Com paredes de material aproveitado. Grande chance de não}

possuir banheiro.

-3 < score ≤ -2 Temos casas nas mesmas condições que a última com pequena chance ter possuir um banheiro pelo menos. -2 < score ≤ -1 Temos algumas casas com grandes chances de ter um banheiro e as paredes serem de alvenaria com um

(11)

-1 < score ≤ -0,5 Observam-se moradias com porte pequeno com um banheiro e paredes de alvenaria.

-0,5< score ≤ 0,0 Grande chance de área construída até 100 m2_{. Casa modesta porem com condições mínimas de posses.}

0,0 < score ≤ 0,5 Daqui a adiante a probabilidade das paredes serem de alvenaria é maior que 80 %. 0,5 < score ≤ 1 Algumas casas com chance de ter dois banheiros e área superior a 100 m2_.

1 < score ≤ 2 Casas com área média 200 m2_{com chances de possuir mais de dois banheiros.}

2 < score ≤ 3 Casas com boa infra-estrutura .

3 < score ≤ 4 Podemos dizer que são casas acima dos padrões da classe média.

Para ajudar no entendimento da comparação do score produzido pela TRI com o Critério Brasil,

deixamos aqui uma representação gráfica para as famílias rotuladas com os dois critérios em questão. Figura 1. Critério Brasil vesus score (via TRI).

NPBRASIL 40 30 20 10 0 -10 ES C O R E S 3 2 1 0 -1 -2 -3 CLBRASIL E D C B2 B1 A2 A1

Assim podemos observar que por exemplo, uma família com escore entre 2 e 3 pertence ao estrato A1 no critério Brasil. Uma família com score entre -3 e -2 está rotulada no Critério Brasil como estrato E. A leitura dos outros deixamos a cargo do leitor. Abaixo, apresenta-se a distribuição dos escores segundo valores de percentis:

Percentis 5 % 10 % 25 % 50 % 75 % 90 % 95 %

Escores -1.6409 -1.2767 -0.6597 -0.0133 0.5740 1.2087 1.5484 Podese perceber que a grande maioria da população em estudo se concentra entre os scores -0,66 e 0,57. O que na descrição das escalas implica em uma população com baixo consumo para alguns itens.

Acreditamos que para uma boa percepção da magnitude do score produzido pela TRI apresentamos um exemplo prático: um indivíduo que possui uma tv; um banheiro; uma máquina de lavar; uma geladeira e não tenha respondido quanto ao seu grau de instrução fica impossibilitado de traçar seu estrato sócio econômico pelo Critério Brasil( ou na pior das hipóteses faz-se os cálculos com os aparelhos listados, ignorando missing e sua pontuação seria sete – isto é classe D), já na TRI o mesmo recebeu um score -0,29 o que já da para inferir a que estrato o respondente está ou compará-lo com a classe D. De acordo com a tabela de leitura de scores da TRI , nos parece que tal respondente não seria um consumidor rotulado como classe D !

9.

Conclusões e Considerações finais.

Pode-se concluir que graças à convergência dos estimadores (pelo método da máxima verossimilhança marginal) e os critérios de ajuste dos modelos que o modelo proposto da TRI está bem

ESCORES são os valores produzidos pela TRI. NPBRASIL é a pontuação do Critério Brasil. A1 a E são os rótulos (classes)do Critério Brasil.

(12)

ajustado aos dados. Não se pode afirmar que a convergência dos parâmetros estimados seja a condição necessária e suficiente para o ajuste, mesmo porque este é um problema em aberto na literatura. Porém, pode-se afirmar que o modelo proposto para a análise de dados está bem formulado e é adequado uma vez que os pressupostos para a garantia de uso foram satisfeitos.

Cabe sempre a formulação da seguinte pergunta: por que o uso da TRI seria mais vantajoso na produção de scores sócio-econômico ao invés do uso de técnicas oriundas da Teoria Clássica de Medidas , como é o caso do critério Brasil, principalmente tendo em vista o resultado da correlação entre os dois índices. A resposta pode ser encarada de várias maneiras:

A TRI não se baseia no teste como um todo ou “true score”, mas sim no(s) item(s) alcançando, assim, mais informação que os modelos clássicos e, portanto, produzindo maior precisão na estimativa individual dos escores. Além disso, ela fornece uma medida do erro que se está cometendo na produção do score, o que pode ser importante, por exemplo, para saber se é necessária a inclusão de novos indicadores, ou não.

O critério Brasil produzido pela teoria clássica necessita que todos os itens na computação do score sejam preenchidos. Basta que pelo menos um item esteja incompleto para que a leitura do mesmo torna-se inviável. Isto pode conduzir à eliminação do respondente da amostra e conseqüentemente do computo final do score. Com a TRI não é bem assim. Não existe nenhuma exigência a priori para que todos os itens estejam respondidos. Basta que algumas respostas tenham sido observadas para que a produção do score será feita. Claro que quanto menor o número de itens respondidos maior será o erro-padrão daquele escore produzido.

A TRI permitirá que se trabalhe com um número variável de questões, não necessariamente o mesmo, que dependerá da precisão desejada para o escore sócio-econômico e que levará em consideração diferenças regionais, por exemplo.

10. Bibliografia.

[1] Andrade, D. F. , Tavares H. R e Valle R. C.(2000). Teoria da resposta ao item: Conceitos e Aplicações. 14ª Sinape.

[2] Baker, F. B. (1995) The Basics of item response theory. Second edition .

[3] Hambleton, R. K., Swaminathan, H. and Rogers, H. J. ((1991). Fundamentals of Item Response Theory. Newbury Park : Sage Publications.

[4] Linden W. J. and Hambleton R. K. (1997) Hanbook of Modern Item Response Theory. Springer Publications.

[5] Malhotra N. K. Pesquisa de marketing: uma orientação aplicada. 3ª edição. Bookman. [6] Dinardo J. and Jhonston J. (2001) Métodos econométricos 4ª edição. Mc Graw Hill.

[7] Mattar F. N. (1995) Analise critica dos estudos de estratificação sócio econômica da ABA-Abipeme. Revista de administração. S. P.

[8] Mattar F. N. (1997) Analise critica dos métodos de estratificação social utilizados em marketing e Pesuisas de marketing. Anais do 2º SEMEAD.

[9] Mattar F. N. (1996) Porque os métodos de classificação socioeconômicos utilizados no Brasil não funcionam. Anais do 20º ENANPAD. Revista Mercado Global

[10] Chapin, S. The Measurement of Social Status, 3. University of Minnesota Press, 1933. [11] O Critério ABA/Abipeme. Revista Mercado Global, p. 41-84, jan./fev. 1984

[12] SSI Scientific Software International. IRT from SSI – Manual of Parscale.

[13] Alexandre J. W. C., Andrade D. F., Vasconcelos A. P. e Araújo de A. M. S – Uma proposta de análise de um constructo para medição de fatores críticos da gestão pela qualidade por intermédio da Tória de Resposta ao Item. Revista Gestão e Produção V.9, n.2 p129-141. Agos 2002.

[14] Soares J. F. e Mambrini J. – Medida do nível sócio econômico dos estudantes em pesquisas educacionais. Maio 2003.

(13)

[15] Lord F. M. Aplications of Item Response Theory to Practical Testing Problems. Hillsdale, N.J.: Eribaum, 1980.

[16] Guttmam, Louis. A Revision of Chapin's Social Status Scale. American Sociological Review, 7, 1942, 362-369.